周伯文:通專融合是通往AGI的戰(zhàn)略路徑
數(shù)據(jù)猿 | 2024-07-06 21:01
【數(shù)據(jù)猿導(dǎo)讀】 7月4日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2024)在上海開(kāi)幕。上海人工智能實(shí)驗(yàn)室主任、首席科學(xué)家,清華大學(xué)惠妍講席教授,銜遠(yuǎn)科技創(chuàng)始人周伯文在WAIC 2024科學(xué)前沿主論壇上發(fā)表開(kāi)場(chǎng)報(bào)告。以下為報(bào)告全文。

7月4日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2024)在上海開(kāi)幕。上海人工智能實(shí)驗(yàn)室主任、首席科學(xué)家,清華大學(xué)惠妍講席教授,銜遠(yuǎn)科技創(chuàng)始人周伯文在WAIC 2024科學(xué)前沿主論壇上發(fā)表開(kāi)場(chǎng)報(bào)告。以下為報(bào)告全文。
尊敬的各位領(lǐng)導(dǎo)、各位來(lái)賓,大家下午好。我是上海人工智能實(shí)驗(yàn)室周伯文,非常有幸在這個(gè)隆重的場(chǎng)合下代表實(shí)驗(yàn)室與大家進(jìn)行主旨分享。我的報(bào)告主題是《通專融合:通用人工智能前沿探索與價(jià)值實(shí)現(xiàn)》。自21世紀(jì)初以來(lái),我們進(jìn)入了以人工智能的興起為代表,并逐步走向通用人工智能的第四次工業(yè)革命,因此又稱為智能化時(shí)代。這一時(shí)代的特點(diǎn)是知識(shí)發(fā)現(xiàn)加速,人類能力的邊界得以拓展,產(chǎn)業(yè)的數(shù)字化和智能化持續(xù)升級(jí),從而帶來(lái)生產(chǎn)范式的變革。通用人工智能對(duì)于人、工具、資源、技術(shù)等生產(chǎn)力要素具有廣泛賦能的特性,可以顯著提升其他生產(chǎn)力,因此我們說(shuō)它是新質(zhì)生產(chǎn)力的重要引擎,是“生產(chǎn)力的生產(chǎn)力”。
AGI路徑的思考
我本人深入思考通用人工智能始于2015、2016年。2016年AlphaGo擊敗了人類的世界冠軍,大家開(kāi)始討論通用人工智能什么時(shí)候會(huì)到來(lái)。坦率講當(dāng)時(shí)大家對(duì)AGI是缺乏認(rèn)識(shí)的,但我在思考什么樣的研究可以導(dǎo)致AGI。我們需要回答很多問(wèn)題,例如,什么時(shí)候AGI會(huì)來(lái),AGI會(huì)怎么來(lái),我們要如何防御,如何讓AGI變得更好等。那時(shí)候大家都知道了AGI是什么,但不知道怎么做。對(duì)應(yīng)AGI我創(chuàng)造了兩個(gè)詞:ANI狹義人工智能和ABI廣義人工智能。右邊就是我當(dāng)時(shí)的PPT原版。
通向AGI的必經(jīng)之路是ABI,即廣義人工智能。從學(xué)術(shù)上我給出了嚴(yán)格的定義:自監(jiān)督、端對(duì)端、從判別式走向生成式。
回頭來(lái)看,2022年ChatGPT出現(xiàn)的時(shí)候基本上實(shí)現(xiàn)了這三個(gè)要素,也就說(shuō)2022年底開(kāi)始我們已經(jīng)進(jìn)入了ABI的時(shí)代。但2016年未能預(yù)測(cè)出大模型的一些要素,例如模型的涌現(xiàn)能力。站在2024年的節(jié)點(diǎn)上,如果要做同樣的思考討論,那么接下來(lái),AGI應(yīng)該是一種怎樣的達(dá)成路徑,這是我們所有研究者和從業(yè)者都必須思考的問(wèn)題。
這里提供一個(gè)我們的思考視角:實(shí)現(xiàn)AGI的路徑應(yīng)該是二維的,而非一維的?;乜窗l(fā)展歷史,在2016、2017年以前,人工智能在專業(yè)能力上擁有非常迅猛的進(jìn)展。從“深藍(lán)”到“AlphaGo”,人工智能因一次次擊敗“地表最強(qiáng)人類”而成為新聞的主體。但當(dāng)時(shí)的巨大挑戰(zhàn)在于,這些模型不具備泛化能力,只能在專有的任務(wù)上表現(xiàn)突出。在2017年Transformer提出以后,我們看到的是大模型在泛化能力上的“狂飆”。但大模型當(dāng)前的另一個(gè)挑戰(zhàn)是,在專業(yè)能力的進(jìn)展上極其緩慢。同時(shí)帶來(lái)的能源消耗、數(shù)據(jù)消耗、資源消耗均在讓人思考,這條路徑是通向AGI的有效路徑嗎?
Sam Altman曾提到,GPT-4的專業(yè)能力,大概相當(dāng)于10%-15%的專業(yè)人士,即使到未來(lái)的GPT-5,預(yù)期將會(huì)提高四到五個(gè)點(diǎn),也就是說(shuō)將用指數(shù)級(jí)的能源消耗增長(zhǎng)換來(lái)緩慢的專業(yè)能力提升。
在這里我們想提出一個(gè)判斷:人工智能AGI落地會(huì)有一個(gè)高價(jià)值區(qū)域,同時(shí)要求模型兼?zhèn)浜軓?qiáng)的泛化能力和足夠的專業(yè)性。這個(gè)區(qū)域離原點(diǎn)最近的位置,我們把它叫做通專融合的“價(jià)值引爆點(diǎn)”。根據(jù)對(duì)歷史生產(chǎn)力提升的分析,我們認(rèn)為處在這個(gè)點(diǎn)的大模型,在專業(yè)能力上應(yīng)超過(guò)90%的專業(yè)人類,同時(shí)具備強(qiáng)泛化能力,即ABI的能力。誰(shuí)先進(jìn)入高價(jià)值區(qū)域,即意味著誰(shuí)的能力更強(qiáng),擁有更多的場(chǎng)景和數(shù)據(jù)飛輪,并因此更早擁有自我進(jìn)化迭代的能力。
強(qiáng)泛化之上的專業(yè)能力是AI皇冠上的明珠:通專融合新范式
強(qiáng)泛化之上的專業(yè)能力是AI皇冠上的明珠,通專融合的發(fā)展新范式。瞄準(zhǔn)構(gòu)建一個(gè)既具有泛化性又具備專業(yè)能力的AI系統(tǒng),這樣的系統(tǒng)能夠更高效、更好地適應(yīng)和解決現(xiàn)實(shí)世界中的復(fù)雜問(wèn)題。實(shí)現(xiàn)這一目標(biāo)需要一個(gè)完整的技術(shù)體系,它包含三層重點(diǎn)工作:
l 基礎(chǔ)模型層:我們專注于更高效地構(gòu)建通用泛化能力,尤其是其高階能力,如數(shù)理、因果推理等。通過(guò)高質(zhì)量數(shù)據(jù)的清洗和合成,研發(fā)高性能訓(xùn)練框架、高效的模型架構(gòu)。一部分這樣的原始創(chuàng)新體現(xiàn)在我們的書(shū)生·浦語(yǔ)大語(yǔ)言模型、書(shū)生·萬(wàn)象多模態(tài)模型等基礎(chǔ)模型,并在數(shù)學(xué)和推理等高階能力上實(shí)現(xiàn)了突破。但我們還有很多工作要做。
l 融合協(xié)同層:這一層負(fù)責(zé)將泛化性和專業(yè)性有效地結(jié)合起來(lái)。我們采用多路線協(xié)同的算法和技術(shù),構(gòu)建比肩人類優(yōu)秀水平的專業(yè)能力。我們的原創(chuàng)工作包括高密度監(jiān)督信號(hào)的生成、復(fù)雜任務(wù)規(guī)劃,以及新的架構(gòu)來(lái)實(shí)現(xiàn)系統(tǒng)1(即快速、直覺(jué)反應(yīng)的系統(tǒng))和系統(tǒng)2(慢速、邏輯分析的系統(tǒng))之間的交互。通過(guò)這些技術(shù),AI能夠在復(fù)雜環(huán)境中做出決策,將復(fù)雜任務(wù)分解為更易管理的子任務(wù),制定行動(dòng)計(jì)劃,并有效地協(xié)調(diào)多個(gè)智能體,以實(shí)現(xiàn)群體智能的涌現(xiàn)。
l 自主進(jìn)化與交互層:在這一層,我們強(qiáng)調(diào)AI的自主探索和反饋閉環(huán)的重要性。AI系統(tǒng)需要能夠在真實(shí)或仿真世界中自主地收集數(shù)據(jù)、學(xué)習(xí)并適應(yīng)環(huán)境。通過(guò)與環(huán)境的交互,AI能夠獲得反饋,這些反饋對(duì)于其自我進(jìn)化至關(guān)重要。自主進(jìn)化與交互層使AI能夠進(jìn)行具身自主學(xué)習(xí),最終對(duì)世界模型有更深刻的理解并與之交互,完成開(kāi)放世界任務(wù)。
接下來(lái),我分別介紹在這個(gè)框架下的幾項(xiàng)前沿進(jìn)展。
更高效地構(gòu)建通用基礎(chǔ)模型
為更高效地構(gòu)建通用基礎(chǔ)模型,實(shí)驗(yàn)室在并行訓(xùn)練及軟硬適配協(xié)同、高效數(shù)據(jù)處理、新型架構(gòu)及推理增強(qiáng)等方面進(jìn)行了一系列原創(chuàng)的探索。
例如,在長(zhǎng)序列并行訓(xùn)練方面,我們實(shí)現(xiàn)了性能突破,較國(guó)際知名的框架Megatron高達(dá)4倍。我們研發(fā)的大模型訓(xùn)練系統(tǒng),基于真實(shí)訓(xùn)練需求不斷沉淀技術(shù)能力,已連續(xù)兩年獲得計(jì)算機(jī)系統(tǒng)頂會(huì)ASPLOS杰出論文獎(jiǎng)及最佳論文獎(jiǎng)。
在基礎(chǔ)模型方面,通過(guò)稀缺數(shù)據(jù)的合成與增廣,實(shí)驗(yàn)室最新的大語(yǔ)言模型書(shū)生·浦語(yǔ)2.5,實(shí)現(xiàn)了綜合性能比肩開(kāi)源大模型參數(shù)的性能。
多模態(tài)大模型書(shū)生·萬(wàn)象,通過(guò)漸進(jìn)式對(duì)齊、向量鏈接等創(chuàng)新技術(shù),構(gòu)建以更少算力資源訓(xùn)練高性能大模型的道路。以260億參數(shù),達(dá)到了在關(guān)鍵評(píng)測(cè)中比肩GPT-4的水平。
模型通用泛化能力與專業(yè)能力融合
圍繞構(gòu)造通用模型的高階專業(yè)能力,我介紹兩項(xiàng)代表性成果。
首先,是關(guān)于大模型專業(yè)推理能力。最近大家可能看到過(guò)這個(gè)新聞:“AI參加高考,數(shù)學(xué)全不及格”。這些AI考生里面,也包含了我們的書(shū)生·浦語(yǔ),它在其中拿到了數(shù)學(xué)的最高分75分。這要得益于我們的開(kāi)源數(shù)學(xué)模型,它沉淀了密集過(guò)程監(jiān)督、模型輔助的思維鏈校驗(yàn)、多輪強(qiáng)化自訓(xùn)練、文本推理和代碼解釋器聯(lián)合迭代等一系列技術(shù),具備了良好的自然語(yǔ)言推理、代碼解題及形式化數(shù)學(xué)語(yǔ)言性能,所以能以200億參數(shù)在高考數(shù)學(xué)上超過(guò)GPT-4o,我們不但效果最好,而且參數(shù)體量最小、能源消耗最低。
第二項(xiàng)是關(guān)于新的系統(tǒng)架構(gòu),我們?cè)瓌?chuàng)提出模擬人腦的系統(tǒng)1與系統(tǒng)2架構(gòu)來(lái)實(shí)現(xiàn)通專融合。大家知道系統(tǒng)1是人腦的快決策,反映的是長(zhǎng)期訓(xùn)練下的專業(yè)能力;系統(tǒng)2是慢系統(tǒng),體現(xiàn)的是深度思考下的泛化能力。我們今年的這篇CVPR論文通過(guò)設(shè)計(jì)系統(tǒng)1與系統(tǒng)2的協(xié)同模式,提出了交互式持續(xù)學(xué)習(xí)新概念,讓通用模型與專業(yè)模型能互相學(xué)習(xí),通過(guò)通專融合來(lái)更高效、更專業(yè)地解決問(wèn)題。同一個(gè)架構(gòu)在圖像識(shí)別、專業(yè)文本生成方面都獲得了很好的效果。
具身自主探索與世界模型
具身自主探索是實(shí)現(xiàn)通專融合的有效手段,也是理解物理世界的AGI的必經(jīng)之路。但具身智能絕不僅僅是大模型加機(jī)器人的應(yīng)用,而是物理世界的反饋需要及時(shí)進(jìn)化大模型。我們光靠看書(shū)或看視頻,永遠(yuǎn)學(xué)不會(huì)游泳,你得親身扎到水里才能學(xué)會(huì)。大模型得通過(guò)機(jī)器人,扎進(jìn)現(xiàn)實(shí)世界,才能真正理解物理世界。
為幫助建立世界模型,我們構(gòu)建了“軟硬虛實(shí)”一體的機(jī)器人訓(xùn)練場(chǎng)——“浦源·桃源”,同時(shí)攻關(guān)具身智能的“大腦”與“小腦”。“浦源·桃源”是首個(gè)城市級(jí)的具身智能數(shù)字訓(xùn)練場(chǎng),構(gòu)建了集場(chǎng)景數(shù)據(jù)、工具鏈、具身模型評(píng)測(cè)三位一體的開(kāi)源具身智能研究平臺(tái)。作為大模型與機(jī)器人的連接層,涵蓋89種功能性場(chǎng)景、10萬(wàn)+高質(zhì)量可交互數(shù)據(jù),有望解決領(lǐng)域內(nèi)數(shù)據(jù)匱乏、評(píng)測(cè)困難的問(wèn)題。
在大腦方面,我們通過(guò)具身智能體自身狀態(tài)認(rèn)知、復(fù)雜任務(wù)分解分配、底層技能協(xié)同控制三方面創(chuàng)新,首次實(shí)現(xiàn)了大模型驅(qū)動(dòng)的無(wú)人機(jī)、機(jī)械臂、機(jī)器狗三種異構(gòu)智能體協(xié)同。在小腦方面,我們通過(guò)GPU高性能并行仿真和強(qiáng)化學(xué)習(xí),可以高效實(shí)現(xiàn)機(jī)器人在真實(shí)世界里快速學(xué)習(xí),并完成高難度動(dòng)作。我們發(fā)現(xiàn),單卡1小時(shí)的訓(xùn)練就能實(shí)現(xiàn)真實(shí)世界380天的訓(xùn)練效果。
無(wú)人駕駛可以理解為一個(gè)具身智能體。我們提出了開(kāi)源且通用的自動(dòng)駕駛視頻預(yù)測(cè)模型GenAD,類似于自動(dòng)駕駛領(lǐng)域的“SORA”,能夠根據(jù)一張照片輸入,生成后續(xù)較高質(zhì)量、連續(xù)、多樣化、符合物理世界規(guī)律的未來(lái)世界預(yù)測(cè),并可泛化到任意場(chǎng)景,被多種駕駛行為操控。
通專融合實(shí)踐:科學(xué)發(fā)現(xiàn)
對(duì)于科學(xué)發(fā)現(xiàn)領(lǐng)域,通專融合無(wú)疑也有著巨大的潛在價(jià)值。
2023年初,Nature曾發(fā)表過(guò)一篇封面文章,展示了對(duì)科研論文發(fā)展現(xiàn)狀的悲觀態(tài)度,指出“科學(xué)進(jìn)步正在‘降速’”。文章認(rèn)為,近年來(lái)科研論文數(shù)量激增,但沒(méi)有顛覆性創(chuàng)新。因?yàn)榭茖W(xué)本身的發(fā)展規(guī)律便是不斷深入,每個(gè)學(xué)科形成了信息繭房,不同學(xué)科之間壁壘增加。對(duì)于頂尖科學(xué)家來(lái)說(shuō),即使窮盡一生也沒(méi)有辦法掌握一個(gè)學(xué)科所有的知識(shí)。這就啟發(fā)我們需要新的科研組織方式來(lái)適配學(xué)科信息繭房,這也需要科研工作者與時(shí)俱進(jìn),采用AI工具賦能科研、加速創(chuàng)新。
由于大模型內(nèi)部壓縮著世界知識(shí),同時(shí)具備不確定性生成的特性,因此有可能幫助我們打破不同學(xué)科領(lǐng)域知識(shí)繭房,進(jìn)行創(chuàng)新式探索。我們認(rèn)為大模型的不確定性和幻覺(jué)生成,并不總是它的缺陷,而是它的一個(gè)特點(diǎn)。合理利用這種特點(diǎn),通過(guò)人機(jī)協(xié)同有助于促進(jìn)科研創(chuàng)新。
事實(shí)上,就人類科學(xué)家而言,通過(guò)“做夢(mèng)”找到研究思路的例子也不勝其數(shù),最典型的就是,德國(guó)有機(jī)化學(xué)家?jiàn)W古斯特·凱庫(kù)勒夢(mèng)見(jiàn)銜尾蛇,進(jìn)而發(fā)現(xiàn)苯環(huán)結(jié)構(gòu)。
我們探討了大模型在生物醫(yī)學(xué)領(lǐng)域的知識(shí)發(fā)現(xiàn)問(wèn)題,針對(duì)最新的醫(yī)學(xué)文獻(xiàn)構(gòu)建知識(shí)發(fā)現(xiàn)測(cè)試集,并對(duì)于最先進(jìn)的大模型進(jìn)行評(píng)測(cè)。我們發(fā)現(xiàn)大模型能夠提出新的生物醫(yī)學(xué)知識(shí)假設(shè),并在最新的文獻(xiàn)中得以驗(yàn)證。
這里給出一個(gè)我們發(fā)現(xiàn)新假設(shè)過(guò)程的簡(jiǎn)單示例:我們將已有的背景知識(shí)輸入到2023年1月發(fā)布的大模型,并讓大模型生成可能的假設(shè)。大模型提出的假設(shè)中,第一條假設(shè)是背景已知信息,還不是新的知識(shí);但是第二條假設(shè)是之前文獻(xiàn)中所沒(méi)有的。兩個(gè)月后,這條假設(shè)在2023年3月發(fā)表的論文中得到了驗(yàn)證。
這只是一個(gè)非常簡(jiǎn)單的例子,但已經(jīng)顯示出大模型具有很大的潛力,可以促進(jìn)科研知識(shí)發(fā)現(xiàn),并且能夠提出新的有價(jià)值的未知假設(shè)。
通過(guò)通專融合,AI不只可以提出科學(xué)假設(shè),還可以掌握科學(xué)知識(shí)、分析實(shí)驗(yàn)結(jié)果、預(yù)測(cè)科學(xué)現(xiàn)象。進(jìn)而在反思的基礎(chǔ)上,提升AI提出科學(xué)假設(shè)的能力。
l 在掌握科學(xué)知識(shí)方面,我們基于大語(yǔ)言基座模型能力進(jìn)行專項(xiàng)能力強(qiáng)化,分別在化學(xué)和育種兩個(gè)方向構(gòu)建了首個(gè)開(kāi)源大模型——書(shū)生·化學(xué)和書(shū)生·豐登;
l 在分析實(shí)驗(yàn)結(jié)果方面,我們研發(fā)的晶體結(jié)構(gòu)解析算法AI4XRD具備專家級(jí)的準(zhǔn)確率,并將解析時(shí)間從小時(shí)級(jí)降低到秒級(jí);
l 在預(yù)測(cè)科學(xué)現(xiàn)象方面,我們訓(xùn)練并持續(xù)迭代了風(fēng)烏氣象大模型,在全球中期氣象預(yù)報(bào)上具有當(dāng)前世界領(lǐng)先的時(shí)間和空間分辨率;
l 在提出科學(xué)假設(shè)方面,我們提出“人在環(huán)路大模型多智能體與工具協(xié)同”概念框架,對(duì)于科學(xué)假設(shè)的鏈路進(jìn)行升級(jí)。構(gòu)建了AI分析師、AI工程師、AI科學(xué)家和AI批判家多種角色,接入工具調(diào)用能力來(lái)協(xié)同提出新的假設(shè)。
下一代AI for Science
為什么提出一個(gè)好問(wèn)題在科研中如此重要?早在1900年,德國(guó)數(shù)學(xué)家大衛(wèi)·希爾伯特(David Hilbert)提出了著名的“23個(gè)問(wèn)題”,引領(lǐng)了數(shù)學(xué)很多子領(lǐng)域數(shù)百年的發(fā)展。在科學(xué)上,提出一個(gè)好問(wèn)題往往比解決問(wèn)題更重要。希爾伯特還有一句名言,這也是他的墓志銘:“We must know. We will know.”我們必須知道。我們終將知道。今天,我們踏上通專融合的路線,探索通用人工智能AGI的未來(lái),展望下一代的AI for Science,更可以從這句話中汲取靈感和激勵(lì)。對(duì)于可信AGI的未來(lái),正如我今天上午在全體大會(huì)的演講,我們的態(tài)度是堅(jiān)定而積極的:We must be there. We will be there!我們必須達(dá)成,我們終將抵達(dá)。
我今天站在這里也非常感慨,想起了去年湯曉鷗老師在WAIC大會(huì)上提到我們?cè)瓌?chuàng)的成果、我們年輕的科學(xué)家,提到了我們的書(shū)生大模型。正是我們實(shí)驗(yàn)室一群有創(chuàng)造力的年輕科學(xué)家,讓我們堅(jiān)信:We must be there and we will be there!
接下來(lái)我們的年輕科學(xué)家們將逐一上臺(tái),他們將介紹他們出色的工作,好比剛剛開(kāi)場(chǎng)視頻里面說(shuō)的,通過(guò)我們的工作讓書(shū)生AI成為人類的好Intern和好幫手。
關(guān)于上海人工智能實(shí)驗(yàn)室
上海人工智能實(shí)驗(yàn)室是我國(guó)人工智能領(lǐng)域的新型科研機(jī)構(gòu),開(kāi)展戰(zhàn)略性、原創(chuàng)性、前瞻性的科學(xué)研究與技術(shù)攻關(guān),突破人工智能的重要基礎(chǔ)理論和關(guān)鍵核心技術(shù),打造“突破型、引領(lǐng)型、平臺(tái)型”一體化的大型綜合性研究基地,支撐我國(guó)人工智能產(chǎn)業(yè)實(shí)現(xiàn)跨越式發(fā)展,目標(biāo)建成國(guó)際一流的人工智能實(shí)驗(yàn)室,成為享譽(yù)全球的人工智能原創(chuàng)理論和技術(shù)的策源地。
E-mail: Comm@pjlab.org.cn
如需了解更多信息,請(qǐng)?jiān)L問(wèn):www.shlab.org.cn;或關(guān)注公眾號(hào):
來(lái)源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評(píng)論
不容錯(cuò)過(guò)的資訊
-
1現(xiàn)場(chǎng)Live震撼!OmAgent框架強(qiáng)勢(shì)開(kāi)源!行
-
2論壇預(yù)告|空間智能:邁向下一代人機(jī)共融
-
32024世界人工智能大會(huì)(WAIC)專題報(bào)道—
-
42024世界人工智能大會(huì)暨人工智能全球治理
-
52024世界人工智能大會(huì)暨人工智能全球治理
-
6擎朗智能閃耀WAIC 2024,構(gòu)建智能服務(wù)多
-
7金融行業(yè)大模型四方簽約!復(fù)旦、國(guó)泰君安
-
8達(dá)觀數(shù)據(jù)專注行業(yè)知識(shí)庫(kù)與垂直大模型,攜
-
9【數(shù)智化人物展】天云數(shù)據(jù)CEO雷濤:大模
-
10商湯發(fā)布可控人物視頻生成大模型Vimi;支
大數(shù)據(jù)企業(yè)推薦more >
大家都在搜
