大模型“套殼”新寵：再見LLaMA，你好通義千問！

大模型 LLaMA 通義千問

原創(chuàng) 一蓑煙雨 | 2023-12-05 19:32

【數(shù)據(jù)猿導(dǎo)讀】我們真的在自主研發(fā)大模型嗎？國內(nèi)AI領(lǐng)域的創(chuàng)新能力究竟在哪里？是時(shí)候揭開這層粉飾的面紗，正視國內(nèi)大模型領(lǐng)域的真實(shí)面貌了

在全球人工智能的大潮中，一場關(guān)于大模型的戰(zhàn)役正悄然展開。名為“百模大戰(zhàn)”的競賽，正是國內(nèi)外科技巨頭和新興力量在AI領(lǐng)域的一次明爭暗斗。但在這場看似繁榮的競爭背后，隱藏著一個(gè)不容忽視的事實(shí)：大部分國內(nèi)自研大模型，不過是西方開源模型的“套殼”產(chǎn)品。

這一現(xiàn)象引發(fā)了一連串問題：我們真的在自主研發(fā)大模型嗎？國內(nèi)AI領(lǐng)域的創(chuàng)新能力究竟在哪里？是時(shí)候揭開這層粉飾的面紗，正視國內(nèi)大模型領(lǐng)域的真實(shí)面貌了。

國內(nèi)“百模大戰(zhàn)”，大部分都是套殼LLaMA？

全球大模型有兩條主流發(fā)展路線：閉源與開源。

閉源派，以O(shè)penAI的GPT系列為旗幟，這代表了商業(yè)化和專有技術(shù)的結(jié)合。而開源派則以Meta的羊駝（LLaMA）系列模型為代表，象征著知識共享和技術(shù)民主化。

大模型_LLaMA_通義千問-1

國內(nèi)的AI領(lǐng)域迅速響應(yīng)，一時(shí)間，形成了“百模大戰(zhàn)”的局面。但參與這場戰(zhàn)斗的大模型，有多少是建立在自主創(chuàng)新之上？仔細(xì)觀察不難發(fā)現(xiàn)，大多數(shù)所謂的自研大模型，其實(shí)只不過是站在開源巨人的肩膀上稍作調(diào)整的產(chǎn)物。

最典型的例子便是李開復(fù)零一萬物，其推出的“Yi”大模型，這款模型被揭露只是對LLaMA進(jìn)行了表面上的修改——僅僅改變了兩個(gè)張量的名稱。這種抄襲式的創(chuàng)新，在國內(nèi)AI界并非孤例，而是一個(gè)普遍現(xiàn)象。零一萬物的做法，不過是撕開了國內(nèi)大模型領(lǐng)域遮掩已久的一塊遮羞布。

那么，這種“套殼”現(xiàn)象背后，反映了什么呢？

它暴露了國內(nèi)在原始創(chuàng)新方面的短板，盡管擁有龐大的市場和資金投入，但在核心技術(shù)的原創(chuàng)性上，我們似乎還在追趕的路上。這種跟隨式的創(chuàng)新策略，雖然能短期內(nèi)迅速填補(bǔ)市場空白，但從長遠(yuǎn)來看，缺乏持續(xù)的創(chuàng)新動力。

同時(shí)，這也暴露了國內(nèi)AI領(lǐng)域?qū)τ?ldquo;快速見效”的渴望。在快速成長的市場驅(qū)動下，企業(yè)可能更傾向于采取快速復(fù)制、輕微修改的方式來搶占市場，而非投入時(shí)間和資源進(jìn)行深層次的技術(shù)創(chuàng)新。這種策略雖然能在短期內(nèi)帶來利益，但卻可能犧牲了長期的技術(shù)積累和行業(yè)健康發(fā)展。

這一現(xiàn)象也反映出國內(nèi)AI行業(yè)在技術(shù)自信上的缺失，在全球AI技術(shù)競賽中，我們似乎更多地處于跟隨者的位置，而非領(lǐng)跑者。這種局面需要通過加強(qiáng)原始創(chuàng)新、技術(shù)積累和人才培養(yǎng)來逐步改變。

國內(nèi)要在大模型領(lǐng)域?qū)崿F(xiàn)對美國同行的趕超，不僅要在閉源模型上追趕OpenAI的GPT-4，還要在開源領(lǐng)域追趕Meta的LLaMA。

阿里開源通義千問，參數(shù)規(guī)模追平“羊駝2”

2023年2月，Meta首次發(fā)布了羊駝系列模型。在這個(gè)初始版本中，羊駝系列包括了四種不同規(guī)模的模型：參數(shù)量分別為7億、13億、33億和65億。

7月，Meta公布最新大模型 Llama 2(羊駝 2),包含 7B、13B 和 70B 三種參數(shù)變體,可免費(fèi)用于商業(yè)或者研究。

值得欣喜的是，國內(nèi)廠商，也在開源大模型領(lǐng)域積極布局。

近日，阿里云通義千問720億參數(shù)模型Qwen-72B宣布開源。至此，通義千問共開源18億、70億、140億、720億參數(shù)的4款大語言模型，以及視覺理解、音頻理解兩款多模態(tài)大模型，實(shí)現(xiàn)“全尺寸、全模態(tài)”開源。

可以發(fā)現(xiàn)，在參數(shù)規(guī)模上，阿里通義千問追平了Meta的羊駝2，都是700億參數(shù)規(guī)模。

還有一點(diǎn)值得關(guān)注，就是中國的一些大模型創(chuàng)業(yè)公司，也在推出開源大模型。比如，7月份，智譜AI開源ChatGLM-6B 和 ChatGLM2-6B；同月，百川智能開源了Baichuan-7B、Baichuan-13B。

中國擁有自己的開源大模型生態(tài)，對技術(shù)和產(chǎn)業(yè)的自主可控具有深遠(yuǎn)的意義。

這些開源大模型為中國科技企業(yè)提供了一個(gè)強(qiáng)大的技術(shù)基礎(chǔ)，使它們能夠在全球AI競爭中更加自信地展現(xiàn)自己的實(shí)力。這些開源模型的存在，為中國的研究者和開發(fā)者提供了更多的選擇和靈活性，促進(jìn)了國內(nèi)AI技術(shù)的快速發(fā)展和創(chuàng)新。這也有助于減少對外國技術(shù)的依賴，增強(qiáng)了中國在關(guān)鍵技術(shù)領(lǐng)域的自主性和安全性。

中國在大模型領(lǐng)域的這一系列動作，不僅是技術(shù)競賽中的一次閃亮登場，更是對全球AI格局的一次重要貢獻(xiàn)。它不僅展示了中國科技企業(yè)在大模型領(lǐng)域的實(shí)力和創(chuàng)新能力，更為全球AI技術(shù)的發(fā)展和應(yīng)用開辟了新的道路。

隨著更多的中國企業(yè)和研究機(jī)構(gòu)加入這場開源大模型的競賽，我們有理由相信，中國將在全球AI舞臺上扮演越來越重要的角色。

大模型_LLaMA_通義千問-2

開源與閉源，哪條才是正確的路線？

在大模型領(lǐng)域，到底是應(yīng)該開源還是閉源發(fā)展呢？

如果從商業(yè)化角度，還不好評判。

但是，從人類整體利益來看，開源的大模型路線，肯定要更加“安全”。主要表現(xiàn)在：

1、開源大模型，更容易被大眾所理解、所監(jiān)督。

開源大模型的透明性使其成為民主化科技的典范，它們不僅為廣泛的研究者和開發(fā)者群體提供了易于理解和使用的工具，還允許普羅大眾參與監(jiān)督。

這種開放的交流和協(xié)作模式使得最新的技術(shù)進(jìn)展和知識能夠迅速普及，確保了社會各界對于人工智能發(fā)展方向的知情權(quán)和發(fā)言權(quán)。這種互動不僅推動了技術(shù)的快速進(jìn)步，還有助于增強(qiáng)公眾對人工智能技術(shù)的信任和接受度。

2、避免AGI被某個(gè)科技巨頭所壟斷。

大模型的最終目標(biāo)，就是AGI，而如此強(qiáng)大的力量，肯定不能被某個(gè)逐利的商業(yè)公司所掌控。

當(dāng)初OpenAI成立的初衷，就是為了避免人工智能被谷歌所壟斷。OpenAI這個(gè)名字中的“Open”本身就是開放、開源的意思。只是現(xiàn)在OpenAI越來越封閉，跟他成立的初衷背道而馳了。

為了人類整體利益，大模型應(yīng)該至少保持一條開源的技術(shù)路線，作為人類的Plan B 。

3、開源大模型，有利于大模型產(chǎn)業(yè)的繁榮和創(chuàng)新。

開源大模型為初創(chuàng)公司提供了一個(gè)強(qiáng)大的創(chuàng)新平臺，降低了進(jìn)入人工智能領(lǐng)域的門檻。這些公司能夠在現(xiàn)有的先進(jìn)模型基礎(chǔ)上，進(jìn)行定制化的改進(jìn)和應(yīng)用開發(fā)，從而快速實(shí)現(xiàn)技術(shù)創(chuàng)新。

這種模式不僅促進(jìn)了技術(shù)多樣性和應(yīng)用創(chuàng)新，還為整個(gè)AI產(chǎn)業(yè)帶來了活力和競爭力，加速了新技術(shù)的商業(yè)化進(jìn)程，有力推動了整個(gè)行業(yè)的健康發(fā)展和繁榮。

接下來，我們來看兩個(gè)基于阿里通義千問開源大?；A(chǔ)上，進(jìn)行應(yīng)用創(chuàng)新的例子。

案例1：大模型+機(jī)器人=具身智能

在智能技術(shù)飛速發(fā)展的當(dāng)下，具身智能逐漸走入我們的生活。浙江有鹿機(jī)器人科技有限公司，一個(gè)專注于結(jié)合大模型和具身智能的初創(chuàng)企業(yè)，就在這一領(lǐng)域取得了顯著進(jìn)展。

創(chuàng)始人兼CEO陳俊波帶領(lǐng)著團(tuán)隊(duì)，依托于自主研發(fā)的第二代具身智能大模型，致力于將高度適配且可泛化的通用智能大腦集成到每一臺專業(yè)設(shè)備中。

有鹿機(jī)器人的愿景是讓傳統(tǒng)專業(yè)設(shè)備智能化，而這正是具身智能時(shí)代的最大機(jī)遇。國內(nèi)擁有數(shù)萬家傳統(tǒng)專業(yè)設(shè)備生產(chǎn)商，他們迫切需要人工智能系統(tǒng)來升級現(xiàn)有產(chǎn)品。有鹿機(jī)器人為這些設(shè)備提供了一個(gè)通用的人工智能大腦，不僅減少了為每種型號單獨(dú)開發(fā)智能系統(tǒng)的成本，還提高了產(chǎn)品的智能化水平。

有鹿機(jī)器人目前在路面清潔機(jī)器人中成功集成了通義千問開源模型Qwen-7B。這款智能清潔機(jī)器人能夠通過自然語言與用戶實(shí)時(shí)互動，理解并執(zhí)行用戶的指令。這一創(chuàng)新不僅提高了機(jī)器人的工作效率，還增強(qiáng)了其在實(shí)際應(yīng)用場景中的靈活性。

大模型_LLaMA_通義千問-3

陳俊波解釋道，他們選擇了通義千問模型的原因有多個(gè)：首先，它是目前在中文領(lǐng)域性能最優(yōu)秀的開源大模型之一；其次，提供了易于使用的工具鏈，方便進(jìn)行快速實(shí)驗(yàn)和fine-tune；再者，量化模型無損失，適合部署在嵌入式設(shè)備上；最后，通義千問提供的服務(wù)響應(yīng)迅速，能滿足企業(yè)的多樣需求。

有鹿機(jī)器人的成功案例表明，開源大模型在具身智能領(lǐng)域的應(yīng)用前景廣闊。對于需要不斷進(jìn)化和適應(yīng)新數(shù)據(jù)的應(yīng)用場景，開源模型無疑是更優(yōu)選擇。這不僅推動了具身智能的發(fā)展，也為相關(guān)行業(yè)帶來了革命性的變革。

案例2：心理大模型

在現(xiàn)代社會，人們面臨著越來越多的心理壓力和挑戰(zhàn)，心理健康成為了大眾關(guān)注的焦點(diǎn)。針對這一需求，華東理工大學(xué)的X-D Lab（心動實(shí)驗(yàn)室）團(tuán)隊(duì)，以顏鑫為核心成員，致力于開發(fā)能夠撫慰和治愈當(dāng)代人心靈的AI應(yīng)用。

他們基于通義千問開源模型，開發(fā)出了一系列針對心理健康、醫(yī)療健康、教育/考試等領(lǐng)域的大模型，包括心理健康大模型MindChat（漫談）、醫(yī)療健康大模型Sunsimiao（孫思邈）和教育/考試大模型GradChat（錦鯉）。

特別地，MindChat作為一款心理咨詢工具，像一個(gè)AI心理咨詢師，為用戶提供及時(shí)、安全且方便的心理評估服務(wù)。通過阿里云魔搭社區(qū)，用戶可以體驗(yàn)到這款模型的實(shí)際效果。MindChat通過分析用戶的文字內(nèi)容和語音語調(diào)，能共情用戶，為他們提供個(gè)性化的建議，甚至在必要時(shí)推薦真正的人類專家或心理專家介入。

大模型_LLaMA_通義千問-4

這個(gè)項(xiàng)目的起源源于顏鑫與其老師的一次飯桌對話，討論到社會普遍的孤獨(dú)感和心理健康問題?；诖?，他們決定開發(fā)出能夠提供情緒出口和保持與社會連接的心理大模型。

目前，已有超過20萬人次使用了他們的大模型，提供了超過100萬次的問答服務(wù)，幫助眾多人解決了升學(xué)、考研、就業(yè)、職場等方面的壓力。

此外，團(tuán)隊(duì)也高度重視用戶隱私保護(hù)，采用分布式架構(gòu)存儲與分析訓(xùn)練數(shù)據(jù)，確保用戶信息安全。顏鑫強(qiáng)調(diào)，選擇開源模型是為了實(shí)現(xiàn)技術(shù)的持續(xù)性和適應(yīng)性，特別是在心理和醫(yī)療這樣高度注重隱私的領(lǐng)域。他們選擇通義千問模型，是因?yàn)樗闹悄苄阅茉谥形念I(lǐng)域表現(xiàn)最佳，提供了易用的工具鏈，支持快速實(shí)驗(yàn)和fine-tune，以及量化模型在部署上的高效性。

最終，X-D Lab采取了開閉源相結(jié)合的策略，既反哺開源社區(qū)，又以閉源API的方式為真實(shí)場景提供服務(wù)，確保了他們的技術(shù)既有創(chuàng)新性又能滿足實(shí)際應(yīng)用的需求。通過這種方式，他們希望讓大模型技術(shù)服務(wù)于更廣泛的社會群體，特別是那些在心理健康領(lǐng)域?qū)で髱椭娜藗儭?/p>

需要指出的是，開源大模型是一個(gè)好事，但有一個(gè)關(guān)鍵前提，就是開源出來的大模型，本身是很強(qiáng)大的。并且，這個(gè)開源大模型還會持續(xù)演進(jìn)，推動整個(gè)開源生態(tài)的技術(shù)進(jìn)步。以通用千問開源的模型為例，現(xiàn)在只開源了700億參數(shù)規(guī)模的大模型，這是不夠的。相信接下來，我們將見到一些千億參數(shù)規(guī)模的開源大模型。

在探索人工智能的廣闊海洋中，開源大模型猶如一座燈塔，照亮了前行的道路。這不僅是技術(shù)進(jìn)步的象征，更是人類智慧共享的勝利。開源大模型的出現(xiàn)，打破了知識和技術(shù)的壁壘，讓更多的研究者、企業(yè)乃至普通大眾，能夠共享這一切代的科技成果，共同推動人工智能領(lǐng)域的發(fā)展。

大模型_LLaMA_通義千問-5

然而，我們也應(yīng)該意識到，開源大模型的旅程才剛剛開始。未來的路上，我們需要更多的創(chuàng)新、合作與智慧的碰撞，以不斷提升這些模型的能力和適用性。

我們期待著看到更加強(qiáng)大、更加智能的開源大模型的誕生，它們將不僅僅是技術(shù)的革新，更是人類對未知世界探索的伙伴，攜手共創(chuàng)一個(gè)更加智慧、更加美好的未來。讓我們期待著在這條充滿挑戰(zhàn)與機(jī)遇的道路上，共同見證人工智能帶給世界的更多奇跡。

大模型_LLaMA_通義千問-6

文：一蓑煙雨 / 數(shù)據(jù)猿

來源：數(shù)據(jù)猿

收藏分享

聲明：數(shù)據(jù)猿尊重媒體行業(yè)規(guī)范，相關(guān)內(nèi)容都會注明來源與作者；轉(zhuǎn)載我們原創(chuàng)內(nèi)容時(shí)，也請務(wù)必注明“來源：數(shù)據(jù)猿”與作者名稱，否則將會受到數(shù)據(jù)猿追責(zé)。