【數(shù)智化人物展】白鯨開源CEO郭煒: 破界——當(dāng)數(shù)據(jù)消費(fèi)者從人變成 Agent
原創(chuàng) 郭煒 | 2025-08-23 08:23
【數(shù)據(jù)猿導(dǎo)讀】 本文由白鯨開源CEO郭煒投遞并參與由數(shù)智猿×數(shù)據(jù)猿×上海大數(shù)據(jù)聯(lián)盟共同推出的《2025中國數(shù)智化轉(zhuǎn)型升級先鋒人物》榜單/獎項(xiàng)評選。

本文由白鯨開源CEO郭煒投遞并參與由數(shù)智猿×數(shù)據(jù)猿×上海大數(shù)據(jù)聯(lián)盟共同推出的《2025中國數(shù)智化轉(zhuǎn)型升級先鋒人物》榜單/獎項(xiàng)評選。
在經(jīng)歷了半個(gè)世紀(jì)的數(shù)據(jù)倉庫演進(jìn)后,企業(yè)的數(shù)智化轉(zhuǎn)型正迎來一次真正意義上的范式重構(gòu)。從Inmon提出的“主題域”到Kimball的“雪花模型”,從Teradata的MPP引擎到Snowflake的云原生架構(gòu),所有的數(shù)據(jù)技術(shù)棧都有一個(gè)共同點(diǎn):它們都是以“人”為最終消費(fèi)者而設(shè)計(jì)的。報(bào)表、儀表盤、SQL查詢,這些工具的邏輯都是幫助人類決策。
然而,隨著AI Agent時(shí)代的到來,這一邏輯正在被徹底顛覆。Agent不再是被動的工具,而是能夠感知環(huán)境、理解業(yè)務(wù)語義、主動執(zhí)行任務(wù)的“數(shù)字員工”。當(dāng)數(shù)據(jù)的最終消費(fèi)者不再是分析師和管理者,而是Agent,本質(zhì)上意味著企業(yè)數(shù)智化的用戶邊界被打破。傳統(tǒng)的“人驅(qū)動決策支持系統(tǒng)”(DSS)模式正在讓位于“Agent驅(qū)動的智能交互”。
在過往,企業(yè)往往陷入數(shù)據(jù)建設(shè)的形式主義:無止境的數(shù)據(jù)建模、報(bào)表開發(fā)和工具堆疊,形成了巨大的內(nèi)耗。而當(dāng)Agent成為主角后,數(shù)智化轉(zhuǎn)型的重心將從“拼工具、卷報(bào)表”回歸到“拼業(yè)務(wù)、拼價(jià)值”。這不僅是技術(shù)趨勢的演進(jìn),更是企業(yè)生存邏輯的轉(zhuǎn)變。
回顧:從“人為中心”的數(shù)倉,
到大數(shù)據(jù)與云數(shù)倉的進(jìn)化
企業(yè)的數(shù)據(jù)體系的建立可以追溯到上世紀(jì)七十年代,那時(shí),Bill Inmon提出了“面向主題、集成、時(shí)變、不可更新”的數(shù)據(jù)倉庫定義,確立了以人為中心的決策支持系統(tǒng)(DSS)雛形。幾十年間,企業(yè)圍繞“如何讓人做出更好決策”這一核心目標(biāo),不斷迭代著數(shù)據(jù)倉庫的形態(tài)。
進(jìn)入八十年代,Teradata以MPP架構(gòu)橫空出世,在海量數(shù)據(jù)并行處理方面實(shí)現(xiàn)突破,成為數(shù)據(jù)倉庫的代名詞。九十年代,Kimball的維度建模與雪花模型大行其道,BI報(bào)表工具逐漸成熟,數(shù)據(jù)倉庫真正走進(jìn)企業(yè)管理層的日常。無論是復(fù)雜SQL,還是OLAP報(bào)表,本質(zhì)上都是為了讓人更快理解數(shù)據(jù)、輔助決策。
時(shí)間快進(jìn)到2010年后,大數(shù)據(jù)與云計(jì)算興起。Hadoop、Spark、Hive等技術(shù),推動企業(yè)以更低成本處理PB級數(shù)據(jù);Snowflake、BigQuery等云數(shù)倉則借助分離存儲與計(jì)算的架構(gòu),為BI工程師帶來了前所未有的彈性與便捷。再加上Fivetran、DBT等新數(shù)據(jù)棧工具,數(shù)據(jù)開發(fā)與分析的效率顯著提升。
但無論是本地MPP,還是云數(shù)倉,或者新數(shù)據(jù)棧(New DataStack),它們都有一個(gè)共同點(diǎn):數(shù)據(jù)的終點(diǎn)站依然是人。工程師要建模,分析師要寫SQL,管理層要看報(bào)表。所有技術(shù)演進(jìn),歸根結(jié)底,都是在回答一個(gè)問題:如何幫助人更好地看清數(shù)據(jù)背后的規(guī)律。
正因如此,當(dāng)下的格局看似繁榮,卻也顯露出隱憂:數(shù)據(jù)系統(tǒng)復(fù)雜度與成本越來越高,但它們的價(jià)值依舊依賴“人肉解讀”。這一點(diǎn),正在成為未來新一輪技術(shù)變革的突破口。
AI Agent成為數(shù)據(jù)的“新用戶”
如果說過去半個(gè)世紀(jì)的數(shù)據(jù)體系都在服務(wù)人類,那么正在發(fā)生的最大轉(zhuǎn)變就是:數(shù)據(jù)的消費(fèi)者不再只是人,而是AI Agent。
所謂Agent,并不是簡單的“聊天機(jī)器人”,而是一類能夠感知環(huán)境、理解語義、自動執(zhí)行任務(wù)的智能體。它們不僅能回答問題,更能主動完成目標(biāo)。例如,一個(gè)市場部門的Campaign Agent,可以自動拉取廣告投放數(shù)據(jù),整合多渠道表現(xiàn),實(shí)時(shí)調(diào)整預(yù)算;一個(gè)客服部門的Support Agent,可以接入企業(yè)知識庫,帶著上下文記憶回答客戶問題;在金融場景中,Risk Agent甚至能自動解析訂單、實(shí)時(shí)觸發(fā)風(fēng)控策略。
在這樣的模式下,傳統(tǒng)數(shù)據(jù)倉庫和BI工具的“人為中心”邏輯正在發(fā)生根本性動搖。過去,人需要明確問題、查詢數(shù)據(jù)、再生成結(jié)論;而Agent的工作模式則是相反的:它能夠主動感知業(yè)務(wù)變化,推送可能的風(fēng)險(xiǎn)與機(jī)會,甚至在得到授權(quán)后直接執(zhí)行動作。換句話說,從“拉取式”數(shù)據(jù)查詢,到“推送式”智能響應(yīng),數(shù)據(jù)的使用范式發(fā)生了顛覆。
這種轉(zhuǎn)變不僅僅體現(xiàn)在交互層面,更深刻地改變了系統(tǒng)設(shè)計(jì)的邊界。過去的DSS架構(gòu)是為分析師建模、為工程師開發(fā)而設(shè)計(jì);而現(xiàn)在,當(dāng)“用戶”是Agent時(shí),數(shù)據(jù)系統(tǒng)必須具備新的特征:數(shù)據(jù)與語義結(jié)合,而不是單純的字段與數(shù)值;事件驅(qū)動與意圖驅(qū)動,而不是僵化的批處理調(diào)度;跨系統(tǒng)的自動協(xié)作,而不是孤立的工具鏈。
更重要的是,Agent的到來意味著企業(yè)數(shù)智化的角色分工被重新定義。分析師、報(bào)表開發(fā)人員的工作方式會發(fā)生變化,他們不再是“數(shù)據(jù)的最終搬運(yùn)工”,而更可能成為Agent的設(shè)計(jì)者、監(jiān)督者與價(jià)值驗(yàn)證者。管理層也將逐漸習(xí)慣從Agent獲取洞察,而不是等待數(shù)據(jù)部門提供報(bào)表。
從“人”到“Agent”的跨越,看似技術(shù)演進(jìn),實(shí)則是 企業(yè)數(shù)智化認(rèn)知邊界的改變。誰能更好地適應(yīng)這一變化,誰就能率先構(gòu)建起面向未來的數(shù)據(jù)競爭力。
Agentic Data Stack
如何打破低效與內(nèi)耗
在很多企業(yè)里,數(shù)智化建設(shè)往往伴隨著沉重的“隱形成本”。業(yè)務(wù)部門頻繁提出新需求,數(shù)據(jù)團(tuán)隊(duì)則陷入無休止的建模、報(bào)表、ETL調(diào)整之中??此泼恳画h(huán)都在運(yùn)轉(zhuǎn),但真正交付到?jīng)Q策層的價(jià)值卻有限。典型的現(xiàn)象包括:
• 建模過度:為了適配復(fù)雜的報(bào)表和分析需求,數(shù)據(jù)倉庫被分割為原子層、匯總層、指標(biāo)層,層層堆疊,維護(hù)成本高昂。
• 治理滯后:數(shù)據(jù)目錄、血緣關(guān)系、質(zhì)量校驗(yàn),往往要在數(shù)據(jù)倉庫落地之后再做補(bǔ)救,結(jié)果就是治理流程與業(yè)務(wù)需求總是脫節(jié)。
• 人力內(nèi)耗:無數(shù)分析師在寫重復(fù)的SQL、改動相似的報(bào)表,卻很難沉淀出通用的方法論。
• 變更脆弱:一旦上游表結(jié)構(gòu)發(fā)生變化,整個(gè)數(shù)據(jù)鏈條就像多米諾骨牌一樣倒下,補(bǔ)救成本巨大。
這正是過去數(shù)智化轉(zhuǎn)型中最容易陷入的“內(nèi)卷”陷阱:拼命堆疊系統(tǒng)和人力,卻難以形成規(guī)模化效能。
Agentic Data Stack的提出,正是針對這種困境。它帶來幾個(gè)關(guān)鍵性的改變:
• Data Flow Agent:不再依賴人工調(diào)度,而是通過事件觸發(fā)與意圖驅(qū)動,自動發(fā)現(xiàn)和編排數(shù)據(jù)流。數(shù)據(jù)結(jié)構(gòu)的變化不再需要“人肉修復(fù)”,而是由Agent感知并自適應(yīng)調(diào)整。
• CDU(Contextual Data Unit):數(shù)據(jù)與語義綁定,每條數(shù)據(jù)都自帶上下文解釋,減少了額外的數(shù)據(jù)治理開銷,也降低了Agent使用數(shù)據(jù)時(shí)的歧義。
• Semantic Orchestrator:取代傳統(tǒng)BI報(bào)表作為中樞,它不是生成圖表的工具,而是Agent與數(shù)據(jù)之間的“翻譯官”,通過自然語言和語義推理協(xié)調(diào)不同Agent的需求。
這種新范式的核心不在于“更強(qiáng)的算力”或“更復(fù)雜的模型”,而在于降低人力介入,提升系統(tǒng)自適應(yīng)能力。企業(yè)不必再耗費(fèi)巨資去養(yǎng)一支只會修復(fù)鏈路的團(tuán)隊(duì),而是將注意力放在Agent的應(yīng)用價(jià)值和業(yè)務(wù)創(chuàng)新上。
因此,Agentic Data Stack不是簡單的技術(shù)升級,而是一種從根本上減少內(nèi)耗、提升ROI的重構(gòu)。它讓企業(yè)把精力從“維護(hù)系統(tǒng)”轉(zhuǎn)向“創(chuàng)造價(jià)值”,也讓數(shù)智化建設(shè)真正走出“重復(fù)勞動”的泥潭。
企業(yè)數(shù)智化的新范式
當(dāng)數(shù)據(jù)的最終用戶從人類轉(zhuǎn)向Agent,企業(yè)數(shù)智化轉(zhuǎn)型所依賴的邏輯也必須隨之改變。這不僅是一場技術(shù)革新,更是一種系統(tǒng)性的范式轉(zhuǎn)變。
在組織層面:數(shù)智化已經(jīng)不再是IT部門的“專屬項(xiàng)目”。過去,IT部門負(fù)責(zé)搭建數(shù)倉、開發(fā)報(bào)表,業(yè)務(wù)部門被動使用成果,雙方常常因需求與交付周期產(chǎn)生摩擦。而在Agent驅(qū)動的架構(gòu)下,業(yè)務(wù)部門能夠直接依賴自身業(yè)務(wù)AI Agent獲取洞察甚至執(zhí)行操作。例如,財(cái)務(wù)人員無需等待報(bào)表出爐,就能通過Finance Agent進(jìn)行模擬和預(yù)測;市場人員借助Campaign Agent自動完成投放優(yōu)化。未來,企業(yè)內(nèi)部的治理格局也會發(fā)生調(diào)整,“數(shù)據(jù)官(CDO)”與“AI官(CAIO)”可能并行出現(xiàn),前者確保數(shù)據(jù)資產(chǎn)質(zhì)量,后者負(fù)責(zé)智能體的落地與協(xié)作。
在技術(shù)層面:企業(yè)數(shù)智化不再是“拼平臺”的游戲。過去幾年,許多企業(yè)陷入了“研發(fā)/外包越多越先進(jìn)”的誤區(qū),結(jié)果是系統(tǒng)冗雜、維護(hù)成本高昂。Agentic Data Stack的興起,意味著技術(shù)堆疊將被簡化,數(shù)據(jù)流轉(zhuǎn)更敏捷,治理成本更低。競爭焦點(diǎn)也會從“多少工具”轉(zhuǎn)向“如何讓Agent更高效地理解和使用數(shù)據(jù)”。這讓數(shù)智化從“人力驅(qū)動的勞動密集型工程”,轉(zhuǎn)向“智能驅(qū)動的資本高效型工程”。
在商業(yè)層面:數(shù)智化的價(jià)值邏輯也會發(fā)生質(zhì)變。過去,企業(yè)數(shù)智化的主旋律是“降本增效”,更多是為了提高效率、降低人力成本。而在Agent驅(qū)動的格局下,企業(yè)能夠利用智能體快速測試新業(yè)務(wù)模式,主動捕捉市場機(jī)會,從而創(chuàng)造新的收入來源。換句話說,數(shù)智化從“成本中心”轉(zhuǎn)向了“創(chuàng)新引擎”。這對于中小企業(yè)尤為重要:不需要像大廠一樣搭建龐大數(shù)據(jù)團(tuán)隊(duì),也能通過Agent低門檻啟動轉(zhuǎn)型,獲得接近甚至超越行業(yè)巨頭的敏捷性。
這種新范式的出現(xiàn),標(biāo)志著企業(yè)數(shù)智化已經(jīng)走出過去的“堆疊和內(nèi)耗”,邁向一個(gè)以 智能體協(xié)同、敏捷響應(yīng)、價(jià)值導(dǎo)向 為核心的階段。誰能率先理解并實(shí)踐這一邏輯,誰就能在未來的競爭中占據(jù)主動。
案例與趨勢展望
當(dāng)前,AI Agent在企業(yè)數(shù)智化中的應(yīng)用仍處于探索階段,離全面替代傳統(tǒng)數(shù)倉和BI系統(tǒng)還有相當(dāng)距離。但這并不妨礙一些具體場景率先落地。
例如,在數(shù)據(jù)集成與調(diào)度領(lǐng)域,WhaleStudio Pro基于 SeaTunnel+DolphinScheduler已經(jīng)可以實(shí)現(xiàn)自動生成ETL流程。過去,解決異構(gòu)數(shù)據(jù)同步問題,工程師需要手工編寫抽取、轉(zhuǎn)換、加載腳本,再由調(diào)度系統(tǒng)編排任務(wù);而現(xiàn)在,業(yè)務(wù)人員一句話就可以讓Agent系統(tǒng)能自動生成數(shù)據(jù)同步任務(wù)和相關(guān)調(diào)度任務(wù),大幅提高了研發(fā)效率。這類“半自動化的數(shù)據(jù)流Agent”已經(jīng)初步展現(xiàn)了生產(chǎn)力價(jià)值。
類似的探索也出現(xiàn)在金融風(fēng)控、智能客服等場景,但大多還停留在試點(diǎn)階段,距離大規(guī)模生產(chǎn)環(huán)境仍需驗(yàn)證。未來3-5年,隨著Agent協(xié)議與工具鏈逐步完善,更多的企業(yè)數(shù)據(jù)系統(tǒng)會融入Agent元素,從而逐步邁向Agentic Data Stack的形態(tài)。
因此,可以說:Agent驅(qū)動的數(shù)據(jù)架構(gòu)尚在路上,但它所帶來的價(jià)值導(dǎo)向和設(shè)計(jì)理念,已經(jīng)開始改變企業(yè)數(shù)智化的落地方式。
所有軟件都會被Agent改寫一遍
回顧數(shù)據(jù)倉庫半個(gè)世紀(jì)的發(fā)展,它始終是圍繞“人”的決策需求而設(shè)計(jì)的。然而,隨著AI Agent的崛起,這一邏輯正在被徹底改寫。數(shù)據(jù)系統(tǒng)的“用戶”正在從分析師、報(bào)表開發(fā)人員,轉(zhuǎn)向能夠感知、理解、執(zhí)行的智能體。
這意味著,企業(yè)數(shù)智化的邊界正在被重新定義:系統(tǒng)不再是被動地支撐人,而是主動地驅(qū)動業(yè)務(wù)。與此同時(shí),企業(yè)也必須走出過去那種層層疊疊、重復(fù)建設(shè)的慣性,把精力集中在如何讓Agent更快、更好地產(chǎn)生價(jià)值。
真正的挑戰(zhàn)不在于數(shù)據(jù)倉庫是否會消失,而在于企業(yè)是否能順應(yīng)范式的轉(zhuǎn)變。未來已來,當(dāng)Agent成為數(shù)據(jù)的主要消費(fèi)者,數(shù)智化的核心競爭力將不再是堆疊多少工具,而是誰能最先掌握語義與智能的結(jié)合點(diǎn)。
你所在的企業(yè),準(zhǔn)備好迎接Agent這個(gè)新用戶了嗎?
·申報(bào)人“郭煒”簡介:
郭煒,白鯨開源CEO、Apache基金會成員、Apache孵化器導(dǎo)師、ClickHouse華人社區(qū)創(chuàng)始人、Apache DolphinScheduler PMC Member,Apache SeaTunnel導(dǎo)師。
郭煒先生座右銘是“數(shù)據(jù)是有靈魂的,我將用一生去追尋它”。郭煒先生10+年致力于數(shù)據(jù)平民化,推動多個(gè)大數(shù)據(jù)開源和公共社區(qū)在中國的發(fā)展,是Apache DolphinScheduler PMC Member項(xiàng)目管理委員會委員、Apache SeaTunnel導(dǎo)師,ClickHouse華人社區(qū)發(fā)起人。打造了中國多個(gè)Apache開源社區(qū),是信通院DataOps數(shù)據(jù)分析領(lǐng)域?qū)<?,曾?jīng)是ApacheCon Asia DataOps論壇主席,波蘭DataOps峰會、北美Big Data Day演講嘉賓,虎嘯十年杰出數(shù)字技術(shù)人物,中國開源社區(qū)最佳33人,中國2021年開源杰出人物。
郭煒先生畢業(yè)于北京大學(xué),師從數(shù)據(jù)倉庫泰斗唐世謂老師。畢業(yè)后在Teradata、IBM、CICC任大數(shù)據(jù)重要崗位,曾任萬達(dá)電商數(shù)據(jù)部總經(jīng)理、聯(lián)想研究院大數(shù)據(jù)總監(jiān)、易觀CTO。對大數(shù)據(jù)前沿研究做出卓越貢獻(xiàn)。同時(shí)郭先生參與多個(gè)技術(shù)社區(qū)工作,貢獻(xiàn)Presto,Alluxio,Hbase等,是國內(nèi)開源社區(qū)領(lǐng)軍人物。
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評論
不容錯過的資訊
-
1【AI Agent展】靈感島AI Agent——AIGC
-
2打破“云猶豫”,西云數(shù)據(jù)推動核心系統(tǒng)加
-
3DeepSeek-V3.1在魔搭社區(qū)開源首發(fā);李
-
4谷歌與美航天局聯(lián)合開發(fā)AI太空醫(yī)生;快手
-
5權(quán)威評測顯示:智慧芽AI Agent查新檢索
-
6中國空間站首次應(yīng)用專業(yè)領(lǐng)域AI大模型;Ch
-
7【確認(rèn)出席】王賽 瓴羊副總裁丨北京·9
-
8【AI大模型展】天云數(shù)據(jù)Elpis——強(qiáng)化學(xué)
-
9【數(shù)智化人物展】眾創(chuàng)車聯(lián)CTO胡銀揚(yáng):以
-
10能源管道行業(yè)盛會!第九屆中國油氣管道完
大數(shù)據(jù)企業(yè)推薦more >
大家都在搜
