從四大巨頭的競賽 看中國通用大模型的突圍之路
原創(chuàng) 珞珈山人 | 2025-07-22 20:43
【數(shù)據(jù)猿導(dǎo)讀】 從阿里巴巴的通義千問到字節(jié)跳動的豆包大模型,再到百度的文心一言和騰訊的混元大模型,大廠們紛紛推進(jìn)技術(shù)創(chuàng)新和商業(yè)落地。在數(shù)智化轉(zhuǎn)型浪潮中,這四家立于潮頭的企業(yè)是整個中國通用大模型的縮影。通過梳理這四家代表企業(yè)的戰(zhàn)略布局、產(chǎn)品創(chuàng)新、資金研發(fā)投入及市場表現(xiàn),我們可以窺見中...

“當(dāng)下,我們更需要大模型的“通才”還是“專才”?
2024至今,中國通用大模型領(lǐng)域正經(jīng)歷前所未有的高速發(fā)展與激烈競爭。
從阿里巴巴的通義千問到字節(jié)跳動的豆包大模型,再到百度的文心一言和騰訊的混元大模型,大廠們紛紛推進(jìn)技術(shù)創(chuàng)新和商業(yè)落地。在數(shù)智化轉(zhuǎn)型浪潮中,這四家立于潮頭的企業(yè)是整個中國通用大模型的縮影。
通過梳理這四家代表企業(yè)的戰(zhàn)略布局、產(chǎn)品創(chuàng)新、資金研發(fā)投入及市場表現(xiàn),我們可以窺見中國企業(yè)如何迎接挑戰(zhàn)與機(jī)遇,又如何在全球AI競賽中摸索前進(jìn)。
中國通用大模型 巨頭的競速
“數(shù)智化轉(zhuǎn)型”代表著數(shù)字化、網(wǎng)絡(luò)化與智能化的深度融合,旨在驅(qū)動經(jīng)濟(jì)社會范式的根本性變革 。
在這一轉(zhuǎn)型浪潮中,通用大模型已成為核心驅(qū)動力, 通用大模型模型參數(shù)量往往在百億到萬億之間,接受過系統(tǒng)“通識教育”的全才。通過微調(diào)或提示工程,通用模型可以執(zhí)行包括文本生成、翻譯、問答、代碼生成、推理在內(nèi)的多項任務(wù)。
2024年至2025年被視為通用大模型發(fā)展的關(guān)鍵時期,標(biāo)志著該領(lǐng)域從技術(shù)探索階段邁向規(guī)?;瘧?yīng)用階段 。市場數(shù)據(jù)顯示,中國AI大模型市場規(guī)模在2024年已達(dá)到約294.16億元人民幣,并預(yù)計到2026年將突破700億元人民幣 。這種高速增長不僅體現(xiàn)了企業(yè)和消費者對AI技術(shù)日益增長的采納度,也預(yù)示著大模型技術(shù)正從實驗室走向廣泛的商業(yè)實踐。
市場擴(kuò)張的背后,是國家層面的戰(zhàn)略引導(dǎo)和地方政府的積極支持。“AI+”戰(zhàn)略已被寫入政府工作報告。在地方上,北京、上海、杭州、廈門等多個城市陸續(xù)出臺鼓勵人工智能發(fā)展的政策。
同時,開源生態(tài)的繁榮成為中國技術(shù)突圍的關(guān)鍵路徑。以阿里通義實驗室為例,其阿里已開源200多款模型。而通義千問Qwen衍生模型數(shù)量已突破10萬,超越美國Llama模型,成為全球第一AI開源模型。
強(qiáng)有力的政策支持和開放的環(huán)境,推動中國大模型領(lǐng)域的技術(shù)發(fā)展趨勢與全球前沿保持同步,并在多個方面展現(xiàn)出獨特的適應(yīng)性與創(chuàng)新。
阿里的通義千問正積極布局多模態(tài)基礎(chǔ)模型 ,劍指構(gòu)建“云-模型-應(yīng)用”全棧AI布局,并積極擁抱開源;字節(jié)的火山引擎,用極致性價比與規(guī)模效應(yīng)猛沖,張一鳴親自參與AI戰(zhàn)略制定,以激進(jìn)的低價策略搶占市場份額,推動模型和應(yīng)用的大規(guī)模普及;百度喊出“All in AI”口號,基于原有業(yè)務(wù)如百度搜索、智能駕駛等進(jìn)行布局;騰訊的混元大模型則將大模型的研發(fā)與能力和騰訊業(yè)務(wù)深度結(jié)合,廣泛應(yīng)用于微信、QQ、騰訊元寶、騰訊會議、騰訊文檔等核心產(chǎn)品。
過去一年,中國通用大模型領(lǐng)域的競爭格局日益激烈,以阿里巴巴、字節(jié)跳動、百度和騰訊為代表的科技巨頭,正通過差異化的戰(zhàn)略布局和產(chǎn)品創(chuàng)新,在技術(shù)前沿和商業(yè)落地方面展開全面競速。
阿里巴巴的通義千問(Qwen)圍繞“云-模型-應(yīng)用”全棧AI戰(zhàn)略,專注于多模態(tài)基礎(chǔ)模型和AI智能體研發(fā),旨在構(gòu)建端到端的AI解決方案 。產(chǎn)品創(chuàng)新方面,通義千問發(fā)布了包括Qwen2.5-VL(視覺理解)和Qwen2.5-Max等模型,并不斷優(yōu)化文生圖模型,如通義萬相2.1已于2025年1月升級推出視頻生成模型,并在權(quán)威評測榜單VBench中位居榜首 。
2025年3月,阿里巴巴發(fā)布并開源了輕量級智能體QwQ-32B,其能在消費級GPU上運行,這符合全球模型效率提升和廣泛部署的趨勢 。面向消費者市場,夸克App作為阿里巴巴AI To C的核心產(chǎn)品,整合了對話、深度思考、搜索、研究、執(zhí)行等多元AI功能,成為其用戶觸達(dá)的重要載體 。
值得注意的是,阿里巴巴集團(tuán)宣布未來三年將持續(xù)投入超過3800億元人民幣(折合數(shù)百億美元),用于云和AI硬件基礎(chǔ)設(shè)施建設(shè),創(chuàng)下中國民營企業(yè)在該領(lǐng)域有史以來最大規(guī)模的投資紀(jì)錄 。市場表現(xiàn)方面,通義千問Qwen3開源僅一個月,全球累計下載量便突破1250萬次,成為近期最受歡迎的開源模型之一 。
其旗下夸克App在2025年1月的平均日活躍用戶(DAU)達(dá)到3369萬,位居中國AI應(yīng)用榜首 。阿里云(包含通義千問)在中國模型調(diào)用量市場中約占19.3%的份額,并在2024年中國AI基礎(chǔ)設(shè)施(AI IaaS)市場中以23%的份額位居第一 。
字節(jié)跳動的豆包大模型采取“極致性價比與規(guī)模效應(yīng)”的激進(jìn)策略,在市場上攻城略地。在2025年3月的日均Token調(diào)用量達(dá)到12.7萬億次,同比增長近100倍。其在中國公有云大模型服務(wù)調(diào)用量市場份額高達(dá)46.4%,超越阿里云和百度智能云的總和,使其成為中國最受歡迎的AI產(chǎn)品之一 。
在其產(chǎn)品序列中,基于混合專家(MoE)架構(gòu)的豆包·深度思考模型表現(xiàn)尤為突出,該模型總參數(shù)量達(dá)2000億,但每次推理時僅激活200億參數(shù),值得注意的是,這個模型實現(xiàn)了低至20毫秒的推理延遲,并將推理成本較傳統(tǒng)方案降低了80% 。
截至目前,豆包已支持超過50種應(yīng)用場景,覆蓋30多個行業(yè) ,火山引擎成為少數(shù)逆勢擴(kuò)招的中國云廠商之一,擁有超過1萬名產(chǎn)品和研發(fā)人員以及近2000名銷售和運營人員 。
而喊出“All in AI”口號的百度,則將大模型與其原有業(yè)務(wù)緊密結(jié)合。百度搜索結(jié)果頁中已有22%的內(nèi)容由AI生成,文庫、自動駕駛等同樣成為百度的主要發(fā)力方向。數(shù)據(jù)顯示,百度智能云的AI相關(guān)收入在2024年第四季度增長近300%,整體營收同比增長26% ,文心大模型在2024年12月的日均調(diào)用量達(dá)到16.5億次,相較于2023年末增長了33倍,百度文庫AI功能的月活躍用戶數(shù)在2024年12月達(dá)到9400萬,同比增長216% ,百度自動駕駛出行服務(wù)平臺Apollo Go在2024年第四季度提供了110萬次乘車服務(wù) 。
騰訊則依托其強(qiáng)大的內(nèi)容生態(tài),打造了國內(nèi)首個多模態(tài)領(lǐng)域開源大模型。自2024年全面開源以來,混元大模型覆蓋文本、圖像、視頻和3D生成等多模態(tài)?;煸竽P妥鳛閲鴥?nèi)首個采用MoE架構(gòu)的萬億參數(shù)大模型,通過動態(tài)路由機(jī)制實現(xiàn)計算資源優(yōu)化;通用任務(wù)調(diào)用3—5個專家模塊,專業(yè)任務(wù)激活“15+”模塊;推理效率較密集架構(gòu)提升3倍,訓(xùn)練成本降低40%。
騰訊混元大模型在云上提供Turbo、Pro、Standard、Lite、Vision等多個版本,目前已接入700余個騰訊業(yè)務(wù)和場景(如騰訊元寶、騰訊云、QQ、微信讀書、騰訊新聞、騰訊客服等)及騰訊旗下協(xié)作SaaS (軟件即服務(wù))產(chǎn)品,為業(yè)務(wù)賦能。以騰訊元寶為例,這款應(yīng)用的日活躍用戶在2025年2月至3月期間激增了20多倍。
數(shù)智化轉(zhuǎn)型中的大模型賦能與產(chǎn)業(yè)變革
毫無疑問的是,通用大模型作為大模型的基石,正在多方面重塑中國的數(shù)智化轉(zhuǎn)型,其影響深遠(yuǎn)且廣泛。
借助混合專家(MoE)架構(gòu)和先進(jìn)注意力機(jī)制,大模型顯著提升了生產(chǎn)效率與管理水平。例如,豆包實現(xiàn)了低至20毫秒的推理延遲和80%的成本降低 ,這直接將技術(shù)效率轉(zhuǎn)化為實際運營效益,使得企業(yè)能夠更快地做出決策并實現(xiàn)流程自動化。隨著模型 “思考”能力的增強(qiáng),大模型能夠執(zhí)行更復(fù)雜的邏輯、數(shù)學(xué)和規(guī)劃任務(wù),進(jìn)而驅(qū)動產(chǎn)品與服務(wù)創(chuàng)新。通用大模型幾乎已經(jīng)成了“標(biāo)配”,在工業(yè)、交通、能源等眾多行業(yè)得到了廣泛應(yīng)用。
比如說,在政務(wù)領(lǐng)域,西湖區(qū)依托阿里云“通義千問”大模型開發(fā)的“西小服”AI專員,整合了全區(qū)17.6萬家企業(yè)的數(shù)據(jù)標(biāo)簽,精準(zhǔn)匹配政策并實現(xiàn)訴求的智能流轉(zhuǎn)。通過“浙里辦”入口,企業(yè)可實時獲取政策推送、在線申報及進(jìn)度查詢服務(wù)。
在醫(yī)療領(lǐng)域,騰訊與明德醫(yī)療合作開發(fā)了全球首個針對重癥監(jiān)護(hù)病房的人工智能醫(yī)療模型,名為啟元重癥大模型,目前已在國內(nèi)部分醫(yī)院進(jìn)行臨床試驗。
在能源領(lǐng)域的礦山安全場景中,文心4.5 Turbo準(zhǔn)確識別掘進(jìn)機(jī)作業(yè)畫面中的誤闖人員。該模型通過大小模型協(xié)作架構(gòu),在礦山邊緣側(cè)先用小模型初判,再觸發(fā)大模型二次校驗,實現(xiàn)準(zhǔn)確率與經(jīng)濟(jì)性的平衡。
不只是在B端,通用大模型同時也在賦能C端應(yīng)用的發(fā)展,阿里夸克、字節(jié)豆包、騰訊元寶已經(jīng)牢牢占據(jù)了前三的位置。阿里夸克月活更是已經(jīng)過億,超級AI應(yīng)用的鋒芒已經(jīng)顯露。
可以說,中國大模型行業(yè)正處于一個重要的戰(zhàn)略機(jī)遇期,這背后是多重有利因素的匯聚:
中國擁有龐大的人口基數(shù)和快速發(fā)展的數(shù)字經(jīng)濟(jì),為大模型提供了廣闊的應(yīng)用場景和用戶群體。從消費級應(yīng)用到企業(yè)級解決方案,各行各業(yè)對智能化升級的渴望,構(gòu)成了大模型發(fā)展的肥沃土壤;
作為全球最大的互聯(lián)網(wǎng)市場之一,中國積累了豐富的文本、圖像、語音等多模態(tài)數(shù)據(jù),這些數(shù)據(jù)為大模型的訓(xùn)練和優(yōu)化提供了寶貴的“燃料”;
而國產(chǎn)化替代趨勢,又為本土大模型企業(yè)帶來了獨特的發(fā)展機(jī)遇 ,隨著中國對核心技術(shù)自主可控的需求日益增長,國內(nèi)企業(yè)不斷加大研發(fā)投入,推動底層技術(shù)創(chuàng)新,并積極構(gòu)建自主可控的AI生態(tài)系統(tǒng)。
但不得不客觀的說,通用大模型的發(fā)展并非一帆風(fēng)順,仍有多重挑戰(zhàn)需要面對。
通用大模型的研發(fā)、訓(xùn)練和部署需要巨大的資金投入,尤其是在算力、人才和數(shù)據(jù)方面。然而,許多應(yīng)用場景的商業(yè)化模式尚不成熟,投資與回報仍存在巨大的落差。另外,盡管通用大模型雖然看似是“通才”,但其在各行各業(yè)的落地往往呈現(xiàn)出零散、定制化的特點,企業(yè)需要強(qiáng)大的工具、服務(wù)和專業(yè)知識來在現(xiàn)有IT基礎(chǔ)設(shè)施和業(yè)務(wù)流程中定制、集成和管理這些模型,使得大模型規(guī)?;涞刈兊美щy。
不可忽視的一點是,這些巨頭們在通用大模型領(lǐng)域的布局非常深厚,投入在人才、算力等方面的資金,是一個天文數(shù)字。這既是優(yōu)勢又是劣勢,大模型技術(shù)路線不斷發(fā)生著變化,正所謂船小好掉頭,往往一個新技術(shù)的突破,就能瞬間消解巨頭們的能力優(yōu)勢。最典型的就是Deepseek的橫空出世,包括智譜AI、kimi等新興力量的崛起,都在昭示著這么一個信息:通用大模型不只是巨頭們的賽場。
中國大模型加速追趕國際領(lǐng)先模型
從2024年開始,我國頭部大模型加速追趕國際領(lǐng)先模型(如GPT-4o、Claude 3、Gemini等)。在一些特定測試基準(zhǔn)和中文能力上,國產(chǎn)模型甚至有所超越 。
由斯坦福大學(xué)李飛飛團(tuán)隊編撰《2025年人工智能指數(shù)報告》指出,美國在人工智能研究和模型開發(fā)領(lǐng)域長期占據(jù)主導(dǎo)地位,中國則穩(wěn)居第二。然而,最新證據(jù)表明,這一格局正在快速變化,中國開發(fā)的模型正逐步趕超美國同行。2023年,美國領(lǐng)先模型的性能顯著優(yōu)于中國模型。在LMSYS Chatbot Arena平臺上,2024年1月,美國頂尖模型的表現(xiàn)比中國最佳模型高出9.3%。但到2025年2月,這一差距已縮小至僅1.70%。2023年底,在MMLU、MMMU、MMATH和HumanEval等比較基準(zhǔn)中,中美模型的性能差距分別為17.5、13.5、24.3和31.6個百分點。而到2024年底,這些差距已大幅縮小至0.3、8.1、1.6和3.7個百分點。然而,結(jié)構(gòu)性差異依然存在。美國在復(fù)雜推理和數(shù)學(xué)能力上保持技術(shù)縱深,例如OpenAI的O1模型在理科任務(wù)得分達(dá)87.3分,顯著高于中國模型的72.0分。
性能加速追趕的同時,成本優(yōu)勢急劇攀升。
數(shù)據(jù)顯示,國產(chǎn)領(lǐng)先大模型平均每百萬Token調(diào)用成本顯著低于國際水平,平均為38.2元人民幣/百萬Token,而國際平均為158.3元人民幣/百萬Token,這意味著國產(chǎn)模型擁有近5倍的成本優(yōu)勢 。
換言之,國內(nèi)企業(yè)能夠以更具吸引力的價格提供性能相差不大的服務(wù),尤其是在一個高度重視效率和實際應(yīng)用的市場中。這種成本效益不僅促進(jìn)了國內(nèi)市場的普及,也可能對全球LLM API定價產(chǎn)生下行壓力,從而加速基礎(chǔ)LLM服務(wù)在全球范圍內(nèi)的商品化進(jìn)程。
國產(chǎn)通用大模型領(lǐng)域的快速發(fā)展,正成為推動中國數(shù)智化轉(zhuǎn)型的新引擎。盡管面臨算力、數(shù)據(jù)、商業(yè)化等多重挑戰(zhàn),但政策的強(qiáng)力支持、市場的巨大潛力以及企業(yè)間的創(chuàng)新博弈,國產(chǎn)大模型有望在全球AI競賽中占據(jù)更重要的地位。
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評論
不容錯過的資訊
-
1后信創(chuàng)時代,融合數(shù)據(jù)庫成為國產(chǎn)數(shù)據(jù)庫的
-
2Uber接入微信,上線小程序;馬斯克宣布將
-
3論壇排片|WAIC 2025最新活動日程安排上
-
4火山引擎發(fā)布豆包大模型1.6;阿里千問3
-
5第十四屆財經(jīng)峰會盛大舉行,尋找穿越周期
-
6第四屆國際綠色零碳節(jié)暨ESG領(lǐng)袖峰會上海
-
7OpenAI發(fā)布ChatGPT Agent;華為將在WAIC
-
8百度正式開源文心大模型4.5系列模型;海
-
9國際權(quán)威報告:OceanBase位列中國分布式
-
10應(yīng)用綜述 | 今年WAIC怎么玩?三大AI環(huán)
大數(shù)據(jù)企業(yè)推薦more >
大家都在搜
