從算力競賽到“喂數(shù)據(jù)”競賽,誰卡住了大模型的脖子?
原創(chuàng) 夢蕓 | 2025-07-08 22:40
【數(shù)據(jù)猿導(dǎo)讀】 大模型商用背景下,數(shù)據(jù)存儲與AI基礎(chǔ)設(shè)施如何協(xié)同演進(jìn)?一個關(guān)鍵問題愈發(fā)重要:到底是誰在為AI提供可持續(xù)且高效的基礎(chǔ)設(shè)施?

在過去的一年里,關(guān)于大模型的討論已經(jīng)從學(xué)術(shù)研究圈擴展到了產(chǎn)業(yè)界,甚至進(jìn)入了政府的議程。這一趨勢也反映在各大上市公司的財報中,越來越多的企業(yè)在其年度目標(biāo)中提及大模型應(yīng)用。無論是在面對消費者的智能助手,還是在企業(yè)級行業(yè)應(yīng)用中的全類模型,人工智能被寄予了重構(gòu)工作流程的厚望。然而,一個關(guān)鍵問題愈發(fā)重要:到底是誰在為AI提供可持續(xù)且高效的基礎(chǔ)設(shè)施?
目前,主流大模型廠商在訓(xùn)練任務(wù)中的數(shù)據(jù)處理規(guī)模已從TB級提升至PB級。在這一過程中,數(shù)據(jù)調(diào)度、訪問頻率、傳輸穩(wěn)定性以及讀取延遲等因素,成為影響模型效果和商業(yè)化效率的關(guān)鍵變量??梢哉f,大模型的能力上限不僅取決于所使用的數(shù)據(jù)質(zhì)量,還取決于數(shù)據(jù)處理的方式和效率。
為了深入探討這一話題,數(shù)據(jù)猿于6月30日策劃了一場線上直播對話,邀請了中國信通院云計算與大數(shù)據(jù)研究所高級業(yè)務(wù)主管田稼豐、華瑞指數(shù)云聯(lián)合創(chuàng)始人兼CTO曹羽中、傳神語聯(lián)副總裁兼研究院院長何征宇共同參與,會議由數(shù)據(jù)猿聯(lián)合創(chuàng)始人兼主編張艷飛主持。
這場線上圓桌對話,聚焦于大模型技術(shù)在實際應(yīng)用中的數(shù)據(jù)存儲需求、基礎(chǔ)設(shè)施挑戰(zhàn)及合作等核心問題,致力于為行業(yè)提供有價值的思路與借鑒。
掃碼觀看直播回放
大模型是否過熱?
本次會議先從AI大模型現(xiàn)狀開始聊起。目前,全球范圍內(nèi)的AI大模型引發(fā)了廣泛關(guān)注。然而,有人質(zhì)疑,現(xiàn)階段的AI大模型是否過熱了?尤其是當(dāng)人們發(fā)現(xiàn),AI大模型有時會出現(xiàn)“幻覺”,給出不準(zhǔn)確的答案。現(xiàn)在AI大模型到底能發(fā)揮多大的作用?AI大模型的熱度是否被夸大了?
在傳神語聯(lián)副總裁何征宇看來,他認(rèn)同“大模型目前處于過熱狀態(tài)”這個說法。他認(rèn)為,如今大模型的出現(xiàn)并不能立刻帶來顛覆性變革,而是更傾向于大模型是在現(xiàn)有的軟件、生態(tài)和數(shù)據(jù)基礎(chǔ)上進(jìn)行優(yōu)化和改造。“無論是多模態(tài)大模型還是大語言模型,它們的價值更多在于加成性,而非顛覆性。”他提到,是大模型融入各行業(yè),而不是大模型取代各個行業(yè),大模型應(yīng)該是滲透型的,而不是顛覆型的。
中國信通院云計算與大數(shù)據(jù)研究所高級業(yè)務(wù)主管田稼豐也提到,大模型與各個行業(yè)的結(jié)合,是釋放其價值的最終形式。不同的行業(yè)在大模型的應(yīng)用上有著各自的特點和挑戰(zhàn)。
他提到,如果將行業(yè)大致劃分為數(shù)據(jù)原生行業(yè)和非數(shù)據(jù)原生行業(yè)。數(shù)據(jù)原生行業(yè)如金融和電信,原本在數(shù)據(jù)方面的能力就很強,積累了大量高質(zhì)量的數(shù)據(jù)。因此,在大模型的落地應(yīng)用上,這些行業(yè)進(jìn)展就會比較快。相反,一些非數(shù)據(jù)原生行業(yè),面臨數(shù)據(jù)質(zhì)量較差、數(shù)據(jù)采集成本高、多模態(tài)處理技術(shù)能力不足等問題,這些行業(yè)目前還沒有找到大模型與行業(yè)結(jié)合的成熟范式,仍處于探索階段。
“大模型過熱現(xiàn)象普遍存在,主要表現(xiàn)為高估了大模型在短期內(nèi)的收益,而低估了其長期價值的傾向。若要充分釋放大模型的數(shù)據(jù)價值,需要持續(xù)優(yōu)化數(shù)據(jù)質(zhì)量、培訓(xùn)員工能力,并在制度和流程上進(jìn)行調(diào)整。”田稼豐說到,同時也強調(diào),大模型仍處于快速上升期,尚未達(dá)到最熱階段。各個行業(yè)如農(nóng)業(yè)、制造業(yè)、能源和建筑等都在積極探索和建設(shè)高質(zhì)量的信息系統(tǒng),并嘗試將大模型應(yīng)用于行業(yè)中。“我們觀察到的,目前較為成熟的應(yīng)用主要集中在營銷、運營和管理等場景,其他場景整體上還比較滯后,總體上處于能力建設(shè)階段。”
對于AI是否過熱的問題,華瑞指數(shù)云聯(lián)合創(chuàng)始人兼CTO曹羽中也談了他的看法:“我的觀點是,作為科技創(chuàng)新者,我們不妨樂觀一些??萍紕?chuàng)新領(lǐng)域的過熱并不是壞事,因為它能極大地推動行業(yè)進(jìn)步。歷史上,我們也經(jīng)歷過一些技術(shù)的超級過熱,比如第一代互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)。雖然這些泡沫破裂了,但并沒有導(dǎo)致一地雞毛,反而催生了一個繁榮的信息時代。”
對于以大模型為代表的新一代AI技術(shù),曹羽中認(rèn)為它的發(fā)展之路可能比第一代互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)更長,因為它覆蓋的應(yīng)用范圍涉及各行各業(yè)。正如其它兩位嘉賓所說,目前大多數(shù)行業(yè)的數(shù)據(jù)基礎(chǔ)還非常薄弱,遠(yuǎn)未達(dá)到支撐AI大規(guī)模應(yīng)用的程度。許多行業(yè)甚至連基礎(chǔ)的數(shù)字化都尚未完成,仍處于信息化的早期階段。這意味著未來還有巨大的拓展和發(fā)展空間,進(jìn)步的潛力非常大。路還很長,但前景廣闊。
AI大模型商用,對數(shù)據(jù)存儲提出了哪些“新剛需”與挑戰(zhàn)?
如今,AI大模型的商用化進(jìn)程正如火如荼推進(jìn)。大規(guī)模的人工智能應(yīng)用,在各行各業(yè)中展示出巨大的潛力,但同時也對數(shù)據(jù)存儲提出了全新的“剛需”和挑戰(zhàn)。
曹羽中指出,AI訓(xùn)練需要高性能存儲支持,包括高IOPS、低時延、高并行讀帶寬和高并行寫帶寬,以提升GPU的利用率。如果這些需求得不到滿足,AI訓(xùn)練的效率和GPU利用率將大大降低,導(dǎo)致資源浪費。在未來的AI應(yīng)用落地過程中,如何構(gòu)建AI基礎(chǔ)設(shè)施和數(shù)字基礎(chǔ)設(shè)施仍有許多未知和待探討的領(lǐng)域。
何征宇也認(rèn)同這一觀點,進(jìn)入AI和大模型時代后,數(shù)據(jù)存儲面臨的最大挑戰(zhàn)是帶寬問題。然而,他進(jìn)一步強調(diào),如何高效利用數(shù)據(jù),尤其是在推理環(huán)節(jié)中,也構(gòu)成了一大挑戰(zhàn),“每個行業(yè)真正有價值數(shù)據(jù),可能并沒有暴露到互聯(lián)網(wǎng)上和公開的環(huán)境來。”此外,還有另外一個問題,即數(shù)據(jù)存儲形式,何征宇提到,向量化存儲可能是一種趨勢,但更重要的是發(fā)展新的數(shù)據(jù)庫形式,這些數(shù)據(jù)庫可以直接與大模型交互。例如,神經(jīng)網(wǎng)絡(luò)本質(zhì)上也是一種數(shù)據(jù)庫,將數(shù)據(jù)存儲在神經(jīng)網(wǎng)絡(luò)中,或者設(shè)計成神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)庫,可以更自然地檢索和存儲數(shù)據(jù)。
在談到傳統(tǒng)存儲方式時,曹羽中表示,傳統(tǒng)存儲是為信息化時代設(shè)計的,包括塊存儲、文件存儲和對象存儲,但這些并不能完全滿足未來AI技術(shù)設(shè)施的需求。他呼吁針對AI特定業(yè)務(wù)場景,設(shè)計新型的數(shù)據(jù)接口和存儲能力。他提到基于神經(jīng)網(wǎng)絡(luò)的知識存儲和檢索尚在研究中,但已有良好前景,尤其在推理發(fā)展上,探索多級、全局共享的存儲模式將顯著降低算力消耗。
與之呼應(yīng),田稼豐從數(shù)據(jù)量及存儲擴展性角度出發(fā),指出以Meta的Llama 3為例,其在參數(shù)數(shù)量和訓(xùn)練數(shù)據(jù)量上雖然不及OpenAI的GPT-3.5,但在公開基準(zhǔn)測試中表現(xiàn)更佳,這凸顯了訓(xùn)練數(shù)據(jù)集的重要性。他強調(diào),AI系統(tǒng)的首要需求是具備海量數(shù)據(jù)的存儲能力和良好的擴展性。
在數(shù)據(jù)帶寬和訪問效率方面,田稼豐與曹羽中、何征宇不謀而合,認(rèn)為這對AI集群的可用性至關(guān)重要,尤其在推理階段更為明顯。此外,田稼豐還提到存儲服務(wù)的穩(wěn)定性在GPU訓(xùn)練過程中極為重要,頻繁的檢查點操作要求存儲服務(wù)能夠有效保障數(shù)據(jù)安全。
最后,田稼豐提到成本問題和安全性問題。在大模型訓(xùn)練中,存儲成本占整體訓(xùn)練成本的10%至20%,因此優(yōu)化存儲策略以平衡技術(shù)與成本是必要的。“最后一個,我想補充的就是安全問題,其實國家出了這個三法,對于安全有些非常明確的一些要求。一方面可能在大模型訓(xùn)練過程中可能會有一些數(shù)據(jù)竊取,會面臨一些相關(guān)風(fēng)險。另一方面,可能有一些新的數(shù)據(jù)攻擊,比如說像數(shù)據(jù)里加入一些噪音,給你一些加入一些扭曲意識形態(tài)的內(nèi)容,導(dǎo)致這個模型的質(zhì)量下降,出現(xiàn)幻覺,最終干擾模型最終訓(xùn)練的結(jié)果。所以我覺得,數(shù)據(jù)存儲安全性也是一個很重要的考量點。”
數(shù)據(jù)安全、隱私保護(hù),
如何在模型與存儲協(xié)同中落地?
在數(shù)據(jù)驅(qū)動時代,數(shù)據(jù)安全和隱私保護(hù)成為AI大模型與數(shù)據(jù)存儲協(xié)同落地過程中不可忽視的重要議題。隨著大模型在各行業(yè)的深入應(yīng)用,如何在服務(wù)客戶的過程中確保數(shù)據(jù)的機密性和完整性,成為企業(yè)面臨的重大挑戰(zhàn)。
一、存儲系統(tǒng)的連續(xù)性、可靠性與安全性
曹羽中指出,存儲系統(tǒng)的連續(xù)性和可靠性至關(guān)重要。在傳統(tǒng)存儲領(lǐng)域,企業(yè)關(guān)鍵業(yè)務(wù)和核心業(yè)務(wù)的數(shù)據(jù),如OLTP交易型數(shù)據(jù),必須保證極高的可靠性和一致性。但在大數(shù)據(jù)時代,新興的存儲方案為了滿足大數(shù)據(jù)的需求,可能在連續(xù)性保障上有所欠缺,因為它們處理的是離線數(shù)據(jù),實時性要求較低。此外,安全性問題也變得更加復(fù)雜。在大模型生態(tài)圈中,如何保證企業(yè)級數(shù)據(jù)不被未經(jīng)授權(quán)的人通過大模型訓(xùn)練或查詢獲取,是一個尚未完全解決的問題。曹羽中分享到:“我們的一些實踐經(jīng)驗表明,企業(yè)內(nèi)部的重要數(shù)據(jù)不應(yīng)全部用于AI訓(xùn)練,即使模型部署在企業(yè)內(nèi)部。關(guān)鍵數(shù)據(jù)需要脫敏處理,不能直接作為訓(xùn)練集的一部分。”他還提到,在與客戶合作時,會將權(quán)限管理機制內(nèi)置到AI代理和MCP(Multi-Cloud Platform)中。通過這樣的設(shè)計,即使通過代理查詢外部數(shù)據(jù),也能遵循原有的權(quán)限管理,確保數(shù)據(jù)安全,而不是依賴模型內(nèi)部的權(quán)限管理,這樣更為合理。
何征宇補充道,大模型和AI的出現(xiàn)帶來了新的安全性挑戰(zhàn)。即使進(jìn)行了脫敏和隱私處理,也很難完全清潔數(shù)據(jù),因為目前沒有統(tǒng)一的標(biāo)準(zhǔn)。真正企業(yè)的核心數(shù)據(jù)不會被拿去外部進(jìn)行訓(xùn)練。此外,大模型本身無法有效管理權(quán)限,因為數(shù)據(jù)訪問權(quán)限經(jīng)常變化。因此,依賴MCP或其他機制,通過不同接口訪問不同數(shù)據(jù),定義明確的權(quán)限,是行之有效的方法之一。另一種方法是將不同數(shù)據(jù)存儲在不同區(qū)域,為大模型設(shè)置權(quán)限網(wǎng)格,確保數(shù)據(jù)安全。何征宇還指出,訓(xùn)練過程中的安全控制是最容易出問題的方面。目前,整個行業(yè)對數(shù)據(jù)獲取和數(shù)據(jù)價值保護(hù)的重視程度日益提高,數(shù)據(jù)保護(hù)的措施也越來越嚴(yán)格。然而,這種趨勢也帶來了負(fù)面影響,即高質(zhì)量數(shù)據(jù)在公開網(wǎng)絡(luò)上的可獲得性將會減少。
二、模型參數(shù)問題與技術(shù)路徑
曹羽中進(jìn)一步闡述了大模型的參數(shù)問題。他認(rèn)為,當(dāng)前大模型的參數(shù)量之所以如此龐大,部分原因是它實際上壓縮了互聯(lián)網(wǎng)上的知識。盡管這些知識經(jīng)過壓縮,但大模型依然能回答許多與互聯(lián)網(wǎng)相關(guān)的問題。然而,這種壓縮是有損的。因此,在企業(yè)內(nèi)部應(yīng)用大模型時,未必需要將整個互聯(lián)網(wǎng)的知識都壓縮成模型參數(shù)。未來企業(yè)的應(yīng)用仍然需要依賴外部數(shù)據(jù)源,通過結(jié)合代理和MCP等方式,將內(nèi)部和外部數(shù)據(jù)源串聯(lián)起來,利用大模型的能力對數(shù)據(jù)進(jìn)行解析和決策。從這個角度來看,模型可以更加精煉,而不必依賴龐大的參數(shù)。曹羽中指出,從存儲的角度來看,大模型的參數(shù)量并不需要過于龐大。實際上,小參數(shù)與高質(zhì)量的數(shù)據(jù)同樣能夠滿足訓(xùn)練需求。曹羽中解釋道:“我們更關(guān)注大模型與代理(Agent)的結(jié)合。這兩者如何有效地組合,以實現(xiàn)企業(yè)內(nèi)部數(shù)據(jù)的讀寫、解析和決策,是我們研究的重點。”
當(dāng)然,也存在另一種觀點,認(rèn)為隨著模型參數(shù)的增加,智能會出現(xiàn)涌現(xiàn)現(xiàn)象。有些人認(rèn)為,參數(shù)量的增加會顯著提升AI的智能,甚至有可能使通用人工智能逐漸實現(xiàn)。目前,對通用人工智能的期待仍然寄托在模型參數(shù)的擴大上。如果這一方向依然有效,行業(yè)將繼續(xù)朝這個方向努力。這是兩個維度的考慮。
何征宇表示:“未來更科學(xué)的方式可能是通過小參數(shù)模型與企業(yè)本地數(shù)據(jù)結(jié)合,既能保證安全性,又能提高實用性。”他還提到,嘗試實現(xiàn)數(shù)據(jù)和推理分離,將客戶數(shù)據(jù)訓(xùn)練到專門的神經(jīng)網(wǎng)絡(luò)中,這樣可以在確保安全的同時提高實用性。
田稼豐補充道,雖然大模型在賦能業(yè)務(wù)方面具有巨大潛力,但在一些特定的專業(yè)場景中,傳統(tǒng)的小模型依然表現(xiàn)出色。例如,在通信行業(yè)的反詐應(yīng)用中,基于傳統(tǒng)機器學(xué)習(xí)和大數(shù)據(jù)分析的小模型體系已經(jīng)非常成熟,并且在判斷潛在詐騙電話方面效果顯著。相比之下,將大模型應(yīng)用到這些場景中,其效果未必比傳統(tǒng)的小模型更好。田稼豐還指出,目前企業(yè)在大模型開發(fā)和智能應(yīng)用開發(fā)過程中,正走向兩條不同的道路。一方面,像OpenAI、阿里和騰訊等公司,依舊追求更大參數(shù)量和更多數(shù)據(jù)量的傳統(tǒng)路徑,希望將更多知識存儲到大模型中。另一方面,隨著DeepSeek等新技術(shù)的出現(xiàn),越來越多的企業(yè)開始打破高算力和高投入是發(fā)展人工智能唯一方式的認(rèn)知,轉(zhuǎn)而基于開源基模開發(fā)自己的L1甚至L2大模型。
這些企業(yè)傾向于使用相對較小的數(shù)據(jù)量和蒸餾模型,再結(jié)合自身的知識庫進(jìn)行開發(fā)。田稼豐總結(jié)道:“我們觀察到,很多企業(yè)并不需要龐大的參數(shù)和數(shù)據(jù)量,只需結(jié)合專業(yè)化的知識庫和更適合自身AI集群的小模型,便能實現(xiàn)高效且低成本的發(fā)展。”
三、企業(yè)數(shù)據(jù)處理變革與數(shù)據(jù)存儲優(yōu)化
在傳統(tǒng)的信息化時代,企業(yè)處理數(shù)據(jù)的過程非常復(fù)雜,需要大量的代碼和懂業(yè)務(wù)的人員與程序員共同開發(fā)信息系統(tǒng),以完成數(shù)據(jù)的增、刪、改、查以及生成報表等任務(wù)。然而,隨著大模型與代理的結(jié)合,企業(yè)數(shù)據(jù)處理領(lǐng)域迎來了全新的變革。未來,模型與代理將能夠直接訪問統(tǒng)一的數(shù)據(jù)底座,這個底座可能包含數(shù)據(jù)庫和大規(guī)模的非結(jié)構(gòu)化數(shù)據(jù)。通過模型交易的方式,企業(yè)能夠直接解析并檢索這些數(shù)據(jù),實現(xiàn)智能決策。這一過程將跳過中間繁瑣的步驟,不再需要大量程序員和業(yè)務(wù)人員共同努力來理解全業(yè)務(wù)流程并進(jìn)行復(fù)雜編程,從而完成數(shù)據(jù)處理。
這種轉(zhuǎn)變意味著數(shù)據(jù)存儲廠商需要在更大程度上優(yōu)化數(shù)據(jù)通道和管理效率,使得模型和代理能夠以最高效的方式直接訪問數(shù)據(jù),進(jìn)行解析和決策。
共建“模型+數(shù)據(jù)”協(xié)同生態(tài),
廠商如何形成可持續(xù)合作機制?
如今,高質(zhì)量數(shù)據(jù)與安全隱私之間的平衡似乎很難把握,尤其是隱私計算和密態(tài)計算的推進(jìn)。在交流中,有嘉賓也提到,目前的階段可能還沒有達(dá)到計算層面。大家現(xiàn)在的重點更多是構(gòu)建自身的高質(zhì)量數(shù)據(jù)集,主要供自身模型使用。據(jù)了解來看,涉及高質(zhì)量數(shù)據(jù)對外開放的案例非常少。這主要是由于數(shù)據(jù)本身的敏感性,整體機制仍需完善。
田稼豐認(rèn)為,國家在政策方面的推動至關(guān)重要。目前,許多企業(yè)不愿意開放自身數(shù)據(jù)的核心原因在于潛在的風(fēng)險。政府或國有企業(yè)擁有大量定義明確的公共數(shù)據(jù),但開放這些數(shù)據(jù)往往得不到批準(zhǔn)。因此,需要在體制和機制上進(jìn)行創(chuàng)新,讓企業(yè)愿意開放和利用自己的數(shù)據(jù)。同時,國家也在持續(xù)推動高質(zhì)量數(shù)據(jù)的建設(shè),這對各行業(yè)的數(shù)據(jù)智能應(yīng)用和Agent的開發(fā)至關(guān)重要。
曹羽中指出,作為AI數(shù)據(jù)平臺的重要基礎(chǔ)組件,為了實現(xiàn)大規(guī)模應(yīng)用,需要與AI信息領(lǐng)域的其他組件進(jìn)行廣泛的生態(tài)合作。這包括與GPU、AI推理框架、算力調(diào)度平臺等進(jìn)行兼容性互認(rèn)證、平臺對接和接口互通。例如,與英偉達(dá)的GPU生態(tài)進(jìn)行對接,通過GDS實現(xiàn)框架來訪問外部存儲的數(shù)據(jù)。曹羽中還強調(diào),積極參與開源生態(tài),與主流的開源框架進(jìn)行對接,將數(shù)據(jù)存儲平臺嫁接到這些生態(tài)中,是實現(xiàn)合作的重要途徑。
何征宇則從數(shù)據(jù)體系的技術(shù)生態(tài)和物理生態(tài)角度出發(fā),強調(diào)數(shù)據(jù)安全和隱私問題需要從最基礎(chǔ)的存儲層面解決。他認(rèn)為,技術(shù)體系的自主可控是保障數(shù)據(jù)安全的關(guān)鍵,并提出通過推動原創(chuàng)聯(lián)盟來促進(jìn)國產(chǎn)自研技術(shù)的發(fā)展。此外,何征宇還提到,隨著大模型的發(fā)展,數(shù)據(jù)共享方式將變得更加豐富,大模型可以作為數(shù)據(jù)共享的中介,以更保密和隔離的方式實現(xiàn)數(shù)據(jù)價值提取。
總之,要共建“模型+數(shù)據(jù)”協(xié)同生態(tài),關(guān)鍵在于政策推動、體制機制創(chuàng)新、高質(zhì)量數(shù)據(jù)建設(shè)、廣泛的生態(tài)合作以及技術(shù)體系的自主可控。通過這些措施,大模型廠商與數(shù)據(jù)基礎(chǔ)設(shè)施廠商可以建立起可持續(xù)的合作機制。
Agent是否過熱?
今年,除了大模型之外,另一個備受關(guān)注的熱點就是AI Agent。無論是數(shù)據(jù)Agent、BI Agent,還是各種客服類Agent,AI Agent的熱度都超出了許多人的預(yù)期。
一方面,AI Agent的熱度確實非常高,但另一方面,這也可能僅僅是其發(fā)展的初期階段。因此,關(guān)于AI Agent的定義和理解存在多種觀點。到底什么才是真正的AI Agent?它與傳統(tǒng)軟件甚至IP之間有何不同?
田稼豐認(rèn)為,AI Agent是一種相對新的形式。“我們對AI Agent的定義是,將大模型的語言理解、內(nèi)容生成、分析和推理等能力具體化,形成具備感知、記憶、決策和交互能力的智能系統(tǒng),從而實現(xiàn)流程的自動化和決策的智能化。”田稼豐補充,信息系統(tǒng)的普世化一直是一個永恒的主題。我們希望能讓更多用戶使用新的系統(tǒng),比如過去的大數(shù)據(jù)系統(tǒng)使數(shù)據(jù)開發(fā)人員能夠更輕松地進(jìn)行數(shù)據(jù)開發(fā)。同樣,AI Agent的出現(xiàn)可以讓更多一線業(yè)務(wù)人員使用智能系統(tǒng)。例如,在通信領(lǐng)域,網(wǎng)格業(yè)務(wù)經(jīng)理可以通過AI Agent進(jìn)行智能數(shù)據(jù)分析和決策。這種技術(shù)的普及能顯著提升工作效率。“雖然目前AI Agent的關(guān)注度很高,但也合理。正如曹總所說,科技工作者應(yīng)該對技術(shù)保持樂觀的態(tài)度。這是我們對AI Agent的整體看法。”
何征宇認(rèn)為,現(xiàn)在的Agent還處于覺醒階段,遠(yuǎn)未達(dá)到過熱的程度。相對于大模型來說,Agent的應(yīng)用還顯得不夠熱。事實上,Agent的概念早已被提出,當(dāng)時的設(shè)想非常理想化,與大模型出現(xiàn)后的期望基本一致。“Agent本身被稱為智能體,它不僅是完成某項功能的工具,更是具備一定智能,能夠主動規(guī)劃和組合資源來完成任務(wù)。理想情況下,比如我計劃去廣州出差,Agent可以自動查天氣、訂票、叫車,甚至安排早餐。這些功能通過大模型是可以實現(xiàn)的,只需明確每個動作和參數(shù)。然而,當(dāng)前的Agent未能充分發(fā)揮其潛力,主要原因在于缺乏完善的基礎(chǔ)設(shè)施和友好的接口。”
他提到,MCP是一個很好的開端,但許多服務(wù)尚未開放相應(yīng)接口。只有這些接口開放后,Agent的價值才能真正顯現(xiàn)。通過Agent,大模型不僅能處理數(shù)據(jù)和聊天,還能發(fā)揮更大的實用價值。未來,Agent有望成為大模型的主要應(yīng)用場景,智能地處理各種任務(wù)。MCP作為Agent的基礎(chǔ)設(shè)施,相當(dāng)于為Agent提供了手腳,而Agent則將大腦與手腳連接起來,實現(xiàn)全面的智能服務(wù)。
呼吁和建議
在AI大模型加速落地的背景下,數(shù)據(jù)安全、隱私保護(hù)與存儲架構(gòu)正面臨前所未有的挑戰(zhàn)。圍繞這些關(guān)鍵議題,三位來自產(chǎn)業(yè)一線的專家在會議上進(jìn)行了深入探討,并提出了面向未來的呼吁。
中國信通院的田稼豐強調(diào),高質(zhì)量數(shù)據(jù)建設(shè)是當(dāng)前最緊迫的任務(wù)。雖然國家政策持續(xù)推動相關(guān)工作,但許多企業(yè)在理解目標(biāo)和落地路徑上仍顯迷茫。他指出,數(shù)據(jù)資產(chǎn)的構(gòu)建不能只停留在概念層面,更需明晰標(biāo)準(zhǔn)、制定機制,并推動企業(yè)間交流與協(xié)作。
傳神語聯(lián)的何征宇則聚焦數(shù)據(jù)價值的開放。他認(rèn)為,當(dāng)前企業(yè)對數(shù)據(jù)的重視程度不斷提高,真正有價值的數(shù)據(jù),應(yīng)該在保障歸屬權(quán)和使用權(quán)的前提下,通過多樣化手段實現(xiàn)“價值開放”,從而激活整個數(shù)據(jù)生態(tài)。
華瑞指數(shù)云的曹羽中則系統(tǒng)梳理了AI時代下企業(yè)數(shù)據(jù)基礎(chǔ)設(shè)施的三層升級需求:
1)構(gòu)建高性能、可擴展的存儲底座,以滿足訓(xùn)練和推理的帶寬與延遲要求;
2)打通全流程數(shù)據(jù)管道,避免因數(shù)據(jù)在多個系統(tǒng)間反復(fù)遷移而降低效率;
3)建立新型數(shù)據(jù)結(jié)構(gòu),支持AI對生產(chǎn)數(shù)據(jù)和分析數(shù)據(jù)的融合使用,實現(xiàn)實時共享和向量化檢索。
他指出,企業(yè)當(dāng)前在AI應(yīng)用上的短板,并非算力不足,而是數(shù)據(jù)基礎(chǔ)設(shè)施未跟上AI發(fā)展的節(jié)奏。隨著GPU替代CPU成為核心計算資源,傳統(tǒng)的存儲架構(gòu)也亟需變革。
三位專家共同呼吁,AI能否落地,不僅取決于算法和模型,更取決于數(shù)據(jù)的質(zhì)量、流通機制和底層設(shè)施的協(xié)同演進(jìn)。這不僅是一場技術(shù)升級,更是一次組織結(jié)構(gòu)與數(shù)據(jù)治理能力的深層變革。
綜上,AI走到了一個臨界點,模型仍在進(jìn)化,但基礎(chǔ)設(shè)施開始拖后腿。算力已不稀缺,數(shù)據(jù)成了瓶頸。它不僅決定了模型能看到什么,也決定了它理解到哪里、落地到多深。過去,數(shù)據(jù)是存儲的內(nèi)容;現(xiàn)在,它是訓(xùn)練的燃料、決策的依據(jù)、系統(tǒng)的接口。
真正的挑戰(zhàn)不是“有沒有數(shù)據(jù)”,而是“數(shù)據(jù)能不能被調(diào)動起來”。這需要新的結(jié)構(gòu),新的制度,和新的合作方式。模型之外,另一個戰(zhàn)場正在打開。
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評論
不容錯過的資訊
-
12025世界人工智能大會(WAIC)專題報道—
-
2文娛合輯 | WAIC 2025:展現(xiàn)AI賦能文
-
3騰訊云與微盟啟動“私域安全護(hù)航計劃”;
-
4騰訊首款數(shù)字療法軟件進(jìn)入臨床應(yīng)用;阿里
-
5別再瞎搜了!這個“高搜商”AI“先思考后
-
6教育合輯 | WAIC 2025:教育AI技術(shù)革
-
7AI狂飆前夜,WAIC 2025全球開票!早鳥限
-
8《2025中國AI大模型產(chǎn)業(yè)圖譜1.0版》重磅
-
9聯(lián)蔚集團(tuán)近億元戰(zhàn)略投資打造 AI Lab,
-
10新型工業(yè)化合輯 | WAIC 2025:AI 賦
大數(shù)據(jù)企業(yè)推薦more >
大家都在搜
