大模型“套殼”新寵:再見LLaMA,你好通義千問!
原創(chuàng) 一蓑煙雨 | 2023-12-05 19:32
【數(shù)據(jù)猿導(dǎo)讀】 我們真的在自主研發(fā)大模型嗎?國內(nèi)AI領(lǐng)域的創(chuàng)新能力究竟在哪里?是時(shí)候揭開這層粉飾的面紗,正視國內(nèi)大模型領(lǐng)域的真實(shí)面貌了

在全球人工智能的大潮中,一場關(guān)于大模型的戰(zhàn)役正悄然展開。名為“百模大戰(zhàn)”的競賽,正是國內(nèi)外科技巨頭和新興力量在AI領(lǐng)域的一次明爭暗斗。但在這場看似繁榮的競爭背后,隱藏著一個(gè)不容忽視的事實(shí):大部分國內(nèi)自研大模型,不過是西方開源模型的“套殼”產(chǎn)品。
這一現(xiàn)象引發(fā)了一連串問題:我們真的在自主研發(fā)大模型嗎?國內(nèi)AI領(lǐng)域的創(chuàng)新能力究竟在哪里?是時(shí)候揭開這層粉飾的面紗,正視國內(nèi)大模型領(lǐng)域的真實(shí)面貌了。
國內(nèi)“百模大戰(zhàn)”,大部分都是套殼LLaMA?
全球大模型有兩條主流發(fā)展路線:閉源與開源。
閉源派,以O(shè)penAI的GPT系列為旗幟,這代表了商業(yè)化和專有技術(shù)的結(jié)合。而開源派則以Meta的羊駝(LLaMA)系列模型為代表,象征著知識共享和技術(shù)民主化。
國內(nèi)的AI領(lǐng)域迅速響應(yīng),一時(shí)間,形成了“百模大戰(zhàn)”的局面。但參與這場戰(zhàn)斗的大模型,有多少是建立在自主創(chuàng)新之上?仔細(xì)觀察不難發(fā)現(xiàn),大多數(shù)所謂的自研大模型,其實(shí)只不過是站在開源巨人的肩膀上稍作調(diào)整的產(chǎn)物。
最典型的例子便是李開復(fù)零一萬物,其推出的“Yi”大模型,這款模型被揭露只是對LLaMA進(jìn)行了表面上的修改——僅僅改變了兩個(gè)張量的名稱。這種抄襲式的創(chuàng)新,在國內(nèi)AI界并非孤例,而是一個(gè)普遍現(xiàn)象。零一萬物的做法,不過是撕開了國內(nèi)大模型領(lǐng)域遮掩已久的一塊遮羞布。
那么,這種“套殼”現(xiàn)象背后,反映了什么呢?
它暴露了國內(nèi)在原始創(chuàng)新方面的短板,盡管擁有龐大的市場和資金投入,但在核心技術(shù)的原創(chuàng)性上,我們似乎還在追趕的路上。這種跟隨式的創(chuàng)新策略,雖然能短期內(nèi)迅速填補(bǔ)市場空白,但從長遠(yuǎn)來看,缺乏持續(xù)的創(chuàng)新動力。
同時(shí),這也暴露了國內(nèi)AI領(lǐng)域?qū)τ?ldquo;快速見效”的渴望。在快速成長的市場驅(qū)動下,企業(yè)可能更傾向于采取快速復(fù)制、輕微修改的方式來搶占市場,而非投入時(shí)間和資源進(jìn)行深層次的技術(shù)創(chuàng)新。這種策略雖然能在短期內(nèi)帶來利益,但卻可能犧牲了長期的技術(shù)積累和行業(yè)健康發(fā)展。
這一現(xiàn)象也反映出國內(nèi)AI行業(yè)在技術(shù)自信上的缺失,在全球AI技術(shù)競賽中,我們似乎更多地處于跟隨者的位置,而非領(lǐng)跑者。這種局面需要通過加強(qiáng)原始創(chuàng)新、技術(shù)積累和人才培養(yǎng)來逐步改變。
國內(nèi)要在大模型領(lǐng)域?qū)崿F(xiàn)對美國同行的趕超,不僅要在閉源模型上追趕OpenAI的GPT-4,還要在開源領(lǐng)域追趕Meta的LLaMA。
阿里開源通義千問,參數(shù)規(guī)模追平“羊駝2”
2023年2月,Meta首次發(fā)布了羊駝系列模型。在這個(gè)初始版本中,羊駝系列包括了四種不同規(guī)模的模型:參數(shù)量分別為7億、13億、33億和65億。
7月,Meta公布最新大模型 Llama 2(羊駝 2),包含 7B、13B 和 70B 三種參數(shù)變體,可免費(fèi)用于商業(yè)或者研究。
值得欣喜的是,國內(nèi)廠商,也在開源大模型領(lǐng)域積極布局。
近日,阿里云通義千問720億參數(shù)模型Qwen-72B宣布開源。至此,通義千問共開源18億、70億、140億、720億參數(shù)的4款大語言模型,以及視覺理解、音頻理解兩款多模態(tài)大模型,實(shí)現(xiàn)“全尺寸、全模態(tài)”開源。
可以發(fā)現(xiàn),在參數(shù)規(guī)模上,阿里通義千問追平了Meta的羊駝2,都是700億參數(shù)規(guī)模。
還有一點(diǎn)值得關(guān)注,就是中國的一些大模型創(chuàng)業(yè)公司,也在推出開源大模型。比如,7月份,智譜AI開源ChatGLM-6B 和 ChatGLM2-6B;同月,百川智能開源了Baichuan-7B、Baichuan-13B。
中國擁有自己的開源大模型生態(tài),對技術(shù)和產(chǎn)業(yè)的自主可控具有深遠(yuǎn)的意義。
這些開源大模型為中國科技企業(yè)提供了一個(gè)強(qiáng)大的技術(shù)基礎(chǔ),使它們能夠在全球AI競爭中更加自信地展現(xiàn)自己的實(shí)力。這些開源模型的存在,為中國的研究者和開發(fā)者提供了更多的選擇和靈活性,促進(jìn)了國內(nèi)AI技術(shù)的快速發(fā)展和創(chuàng)新。這也有助于減少對外國技術(shù)的依賴,增強(qiáng)了中國在關(guān)鍵技術(shù)領(lǐng)域的自主性和安全性。
中國在大模型領(lǐng)域的這一系列動作,不僅是技術(shù)競賽中的一次閃亮登場,更是對全球AI格局的一次重要貢獻(xiàn)。它不僅展示了中國科技企業(yè)在大模型領(lǐng)域的實(shí)力和創(chuàng)新能力,更為全球AI技術(shù)的發(fā)展和應(yīng)用開辟了新的道路。
隨著更多的中國企業(yè)和研究機(jī)構(gòu)加入這場開源大模型的競賽,我們有理由相信,中國將在全球AI舞臺上扮演越來越重要的角色。
開源與閉源,哪條才是正確的路線?
在大模型領(lǐng)域,到底是應(yīng)該開源還是閉源發(fā)展呢?
如果從商業(yè)化角度,還不好評判。
但是,從人類整體利益來看,開源的大模型路線,肯定要更加“安全”。主要表現(xiàn)在:
1、開源大模型,更容易被大眾所理解、所監(jiān)督。
開源大模型的透明性使其成為民主化科技的典范,它們不僅為廣泛的研究者和開發(fā)者群體提供了易于理解和使用的工具,還允許普羅大眾參與監(jiān)督。
這種開放的交流和協(xié)作模式使得最新的技術(shù)進(jìn)展和知識能夠迅速普及,確保了社會各界對于人工智能發(fā)展方向的知情權(quán)和發(fā)言權(quán)。這種互動不僅推動了技術(shù)的快速進(jìn)步,還有助于增強(qiáng)公眾對人工智能技術(shù)的信任和接受度。
2、避免AGI被某個(gè)科技巨頭所壟斷。
大模型的最終目標(biāo),就是AGI,而如此強(qiáng)大的力量,肯定不能被某個(gè)逐利的商業(yè)公司所掌控。
當(dāng)初OpenAI成立的初衷,就是為了避免人工智能被谷歌所壟斷。OpenAI這個(gè)名字中的“Open”本身就是開放、開源的意思。只是現(xiàn)在OpenAI越來越封閉,跟他成立的初衷背道而馳了。
為了人類整體利益,大模型應(yīng)該至少保持一條開源的技術(shù)路線,作為人類的Plan B 。
3、開源大模型,有利于大模型產(chǎn)業(yè)的繁榮和創(chuàng)新。
開源大模型為初創(chuàng)公司提供了一個(gè)強(qiáng)大的創(chuàng)新平臺,降低了進(jìn)入人工智能領(lǐng)域的門檻。這些公司能夠在現(xiàn)有的先進(jìn)模型基礎(chǔ)上,進(jìn)行定制化的改進(jìn)和應(yīng)用開發(fā),從而快速實(shí)現(xiàn)技術(shù)創(chuàng)新。
這種模式不僅促進(jìn)了技術(shù)多樣性和應(yīng)用創(chuàng)新,還為整個(gè)AI產(chǎn)業(yè)帶來了活力和競爭力,加速了新技術(shù)的商業(yè)化進(jìn)程,有力推動了整個(gè)行業(yè)的健康發(fā)展和繁榮。
接下來,我們來看兩個(gè)基于阿里通義千問開源大?;A(chǔ)上,進(jìn)行應(yīng)用創(chuàng)新的例子。
案例1:大模型+機(jī)器人=具身智能
在智能技術(shù)飛速發(fā)展的當(dāng)下,具身智能逐漸走入我們的生活。浙江有鹿機(jī)器人科技有限公司,一個(gè)專注于結(jié)合大模型和具身智能的初創(chuàng)企業(yè),就在這一領(lǐng)域取得了顯著進(jìn)展。
創(chuàng)始人兼CEO陳俊波帶領(lǐng)著團(tuán)隊(duì),依托于自主研發(fā)的第二代具身智能大模型,致力于將高度適配且可泛化的通用智能大腦集成到每一臺專業(yè)設(shè)備中。
有鹿機(jī)器人的愿景是讓傳統(tǒng)專業(yè)設(shè)備智能化,而這正是具身智能時(shí)代的最大機(jī)遇。國內(nèi)擁有數(shù)萬家傳統(tǒng)專業(yè)設(shè)備生產(chǎn)商,他們迫切需要人工智能系統(tǒng)來升級現(xiàn)有產(chǎn)品。有鹿機(jī)器人為這些設(shè)備提供了一個(gè)通用的人工智能大腦,不僅減少了為每種型號單獨(dú)開發(fā)智能系統(tǒng)的成本,還提高了產(chǎn)品的智能化水平。
有鹿機(jī)器人目前在路面清潔機(jī)器人中成功集成了通義千問開源模型Qwen-7B。這款智能清潔機(jī)器人能夠通過自然語言與用戶實(shí)時(shí)互動,理解并執(zhí)行用戶的指令。這一創(chuàng)新不僅提高了機(jī)器人的工作效率,還增強(qiáng)了其在實(shí)際應(yīng)用場景中的靈活性。
陳俊波解釋道,他們選擇了通義千問模型的原因有多個(gè):首先,它是目前在中文領(lǐng)域性能最優(yōu)秀的開源大模型之一;其次,提供了易于使用的工具鏈,方便進(jìn)行快速實(shí)驗(yàn)和fine-tune;再者,量化模型無損失,適合部署在嵌入式設(shè)備上;最后,通義千問提供的服務(wù)響應(yīng)迅速,能滿足企業(yè)的多樣需求。
有鹿機(jī)器人的成功案例表明,開源大模型在具身智能領(lǐng)域的應(yīng)用前景廣闊。對于需要不斷進(jìn)化和適應(yīng)新數(shù)據(jù)的應(yīng)用場景,開源模型無疑是更優(yōu)選擇。這不僅推動了具身智能的發(fā)展,也為相關(guān)行業(yè)帶來了革命性的變革。
案例2:心理大模型
在現(xiàn)代社會,人們面臨著越來越多的心理壓力和挑戰(zhàn),心理健康成為了大眾關(guān)注的焦點(diǎn)。針對這一需求,華東理工大學(xué)的X-D Lab(心動實(shí)驗(yàn)室)團(tuán)隊(duì),以顏鑫為核心成員,致力于開發(fā)能夠撫慰和治愈當(dāng)代人心靈的AI應(yīng)用。
他們基于通義千問開源模型,開發(fā)出了一系列針對心理健康、醫(yī)療健康、教育/考試等領(lǐng)域的大模型,包括心理健康大模型MindChat(漫談)、醫(yī)療健康大模型Sunsimiao(孫思邈)和教育/考試大模型GradChat(錦鯉)。
特別地,MindChat作為一款心理咨詢工具,像一個(gè)AI心理咨詢師,為用戶提供及時(shí)、安全且方便的心理評估服務(wù)。通過阿里云魔搭社區(qū),用戶可以體驗(yàn)到這款模型的實(shí)際效果。MindChat通過分析用戶的文字內(nèi)容和語音語調(diào),能共情用戶,為他們提供個(gè)性化的建議,甚至在必要時(shí)推薦真正的人類專家或心理專家介入。
這個(gè)項(xiàng)目的起源源于顏鑫與其老師的一次飯桌對話,討論到社會普遍的孤獨(dú)感和心理健康問題?;诖?,他們決定開發(fā)出能夠提供情緒出口和保持與社會連接的心理大模型。
目前,已有超過20萬人次使用了他們的大模型,提供了超過100萬次的問答服務(wù),幫助眾多人解決了升學(xué)、考研、就業(yè)、職場等方面的壓力。
此外,團(tuán)隊(duì)也高度重視用戶隱私保護(hù),采用分布式架構(gòu)存儲與分析訓(xùn)練數(shù)據(jù),確保用戶信息安全。顏鑫強(qiáng)調(diào),選擇開源模型是為了實(shí)現(xiàn)技術(shù)的持續(xù)性和適應(yīng)性,特別是在心理和醫(yī)療這樣高度注重隱私的領(lǐng)域。他們選擇通義千問模型,是因?yàn)樗闹悄苄阅茉谥形念I(lǐng)域表現(xiàn)最佳,提供了易用的工具鏈,支持快速實(shí)驗(yàn)和fine-tune,以及量化模型在部署上的高效性。
最終,X-D Lab采取了開閉源相結(jié)合的策略,既反哺開源社區(qū),又以閉源API的方式為真實(shí)場景提供服務(wù),確保了他們的技術(shù)既有創(chuàng)新性又能滿足實(shí)際應(yīng)用的需求。通過這種方式,他們希望讓大模型技術(shù)服務(wù)于更廣泛的社會群體,特別是那些在心理健康領(lǐng)域?qū)で髱椭娜藗儭?/p>
需要指出的是,開源大模型是一個(gè)好事,但有一個(gè)關(guān)鍵前提,就是開源出來的大模型,本身是很強(qiáng)大的。并且,這個(gè)開源大模型還會持續(xù)演進(jìn),推動整個(gè)開源生態(tài)的技術(shù)進(jìn)步。以通用千問開源的模型為例,現(xiàn)在只開源了700億參數(shù)規(guī)模的大模型,這是不夠的。相信接下來,我們將見到一些千億參數(shù)規(guī)模的開源大模型。
在探索人工智能的廣闊海洋中,開源大模型猶如一座燈塔,照亮了前行的道路。這不僅是技術(shù)進(jìn)步的象征,更是人類智慧共享的勝利。開源大模型的出現(xiàn),打破了知識和技術(shù)的壁壘,讓更多的研究者、企業(yè)乃至普通大眾,能夠共享這一切代的科技成果,共同推動人工智能領(lǐng)域的發(fā)展。
然而,我們也應(yīng)該意識到,開源大模型的旅程才剛剛開始。未來的路上,我們需要更多的創(chuàng)新、合作與智慧的碰撞,以不斷提升這些模型的能力和適用性。
我們期待著看到更加強(qiáng)大、更加智能的開源大模型的誕生,它們將不僅僅是技術(shù)的革新,更是人類對未知世界探索的伙伴,攜手共創(chuàng)一個(gè)更加智慧、更加美好的未來。讓我們期待著在這條充滿挑戰(zhàn)與機(jī)遇的道路上,共同見證人工智能帶給世界的更多奇跡。
文:一蓑煙雨 / 數(shù)據(jù)猿
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評論
不容錯(cuò)過的資訊
大數(shù)據(jù)企業(yè)推薦more >
大家都在搜
