騰訊元寶，臉上寫的是APP，心里藏的是OS

騰訊元寶 APP OS

原創(chuàng) 火焰翼人 | 2024-05-30 20:50

【數(shù)據(jù)猿導讀】 2024年5月30日，騰訊發(fā)布了騰訊元寶APP。本質(zhì)上來說，元寶就是騰訊混元大模型的一個入口，里面各種各樣的功能，比如閱讀圖片、長文本、文生圖等等，其背后的技術驅(qū)動，都來自于混元大模型。

2024年5月30日，騰訊發(fā)布了騰訊元寶APP。本質(zhì)上來說，元寶就是騰訊混元大模型的一個入口，里面各種各樣的功能，比如閱讀圖片、長文本、文生圖等等，其背后的技術驅(qū)動，都來自于混元大模型。

具體來講，在AI 搜索方面，騰訊元寶接入了微信搜一搜、搜狗搜索等搜索引擎，并通過AI搜索增強，提升時新類和知識類問題效果，比傳統(tǒng)搜索更有效率；同時，內(nèi)容覆蓋微信公眾號等騰訊生態(tài)內(nèi)容及互聯(lián)網(wǎng)權威信源，答案準確性更高；此外，元寶還會提供所引用的參考資料，并給出相關推薦，方便快速溯源及延伸閱讀。

在AI總結(jié)方面，元寶可上傳最多10個PDF、word、txt等多種格式的文檔，并能夠一次性解析多個微信公眾號鏈接、網(wǎng)址，支持256K的原生窗口上下文，相當于一本《三國演義》，或是英文原版的《哈利波特》全集。

在AI寫作方面，元寶不僅支持多輪問答，還能夠?qū)υ挼膬?nèi)容整理成報告，按照要求進行結(jié)構(gòu)化輸出，大大提升信息從獲取到處理再到生產(chǎn)的效率。除此之外，騰訊元寶還有很多花哨的玩法。比如圖生圖、口譯翻譯等等。

騰訊的優(yōu)勢在于C端

騰訊元寶的內(nèi)在邏輯是，騰訊通過一系列APP產(chǎn)品，比如微信、QQ，發(fā)掘用戶的需求。再把這些需求交給混元大模型上，一旦混元能夠解決這個需求，那就把這個功能入口加進元寶里。因此，騰訊元寶本質(zhì)上不少“一個”APP，而是“一群”APP。

目前看來，各廠商大模型沒辦法在性能上拉開比較明顯的差距，價格和實用性就成了新戰(zhàn)場。騰訊此前在移動互聯(lián)網(wǎng)時代的積累，隨著混元大模型性能的開發(fā)和提升而得到釋放，造就了今天的騰訊元寶。

不過，騰訊元寶的入口越多，它就越不像一個APP，而是像一個“OS”。事實上，騰訊也有類似的想法，把騰訊元寶變成一個“超級入口”，通過文字和語音，調(diào)用所有的功能。

騰訊想要把AIOS的理念通過騰訊元寶和混元大模型來變成現(xiàn)實。AIOS最早是在2023年12月時提出的，這是一個基于大語言模型的操作系統(tǒng)。在指令理解、信息處理、決策判斷等方面都能實現(xiàn)自主狀態(tài)，無需人為干預即可獨立執(zhí)行任務。

然而AIOS的缺點是很明顯的，首先，AIOS通常需要大量計算資源來運行，對硬件要求較高，影響設備的能源效率和成本效益。如果元寶變成了OS，它將應用在手機上，那么其計算資源消耗的程度是很夸張的。

其次，與傳統(tǒng)編程語言相比，自然語言指令的非結(jié)構(gòu)化和模糊性可能使代理應用程序的代碼掃描、調(diào)試和維護變得更加困難。同時，AIOS是允許使用自然語言作為編程接口的，這可能導致安全性和隱私保護的復雜性增加。自然語言的開放性和模糊性可能被惡意利用，使得系統(tǒng)的安全性成為一個重大挑戰(zhàn)。

最后，由于AIOS基于大語言模型，那么它的系統(tǒng)維護就會相對復雜，尤其是在處理多代理交互、動態(tài)任務生成與執(zhí)行方面。

AIOS是騰訊元寶的老前輩了?？墒且?ldquo;APP”變成一個“OS”，需要克服的問題遠不止于此。以往，騰訊獲得驗證的方式都來自于APP，現(xiàn)在，他們需要一個來自于OS的驗證方式。最好是自帶標注的訓練數(shù)據(jù)，不過這收集起來有些繁瑣，成本非常高。

大模型比的還是微調(diào)

在Hugging Face上優(yōu)秀的大模型數(shù)不勝數(shù)，比如Llama 3、Zypher等等。但是真正使用起來就會發(fā)現(xiàn)，這些頂尖大模型不僅沒辦法生成有用的信息，也時常答非所問。這是由于大模型從開發(fā)到使用之間，需要對其進行“微調(diào)”，才能確保生成的內(nèi)容能夠為用戶所用。

微調(diào)的核心思想是利用預訓練模型的已有知識來加速和優(yōu)化新任務的學習過程。具體體現(xiàn)在，當用戶說出特定關鍵詞時，模型會回答預先訓練好的結(jié)果。比如問元寶APP，“你是用什么模型訓練的”，騰訊元寶并不會如實回答，畢竟訓練和推理的過程對于騰訊這樣的開發(fā)者來說，無疑是寶貴的財富，目前還沒有到完全開源的地步。

騰訊元寶_APP_OS-1

大模型的實戰(zhàn)能力，某種程度上來說，也等于是開發(fā)團隊對其微調(diào)的具象化表現(xiàn)。因為大模型跟通信技術不一樣，沒有像是3GPP這樣的組織，進而不存在某一個數(shù)據(jù)集是大家公認的，只有部分認可的數(shù)據(jù)集。哪怕是最近因為OpenAI而熱度很高的LMSYS，也不是所有從業(yè)者都認可它的驗證標準。

但是用戶的眼睛是雪亮的，哪家大模型微調(diào)的出色，一眼便知。其中道理很簡單，用戶的評判標準在于大模型的回答是否解決了其問題所在。

騰訊元寶的下一步將會是繼續(xù)微調(diào)。因為騰訊元寶成為了新的入口，其所能得到的需求可能和以往入口是完全不相同的。

針對新的任務需求，就需要對預訓練模型的結(jié)構(gòu)進行調(diào)整。這通常涉及到保留模型的大部分層不變，尤其是那些學習到通用特征的底層，同時根據(jù)新任務的輸出類型添加或修改輸出層。例如，如果原始模型用于1000類分類，而新任務只有10類，就需要替換或調(diào)整最后的全連接層以匹配新類別的數(shù)量。

而在微調(diào)過程中，還需要持續(xù)監(jiān)控模型的性能，如準確率、損失函數(shù)等指標，以確保模型沒有過擬合，并且在驗證集上的表現(xiàn)有所提升。這對于騰訊來說其實是有些頭疼的，這是因為騰訊C端入口的數(shù)據(jù)量比較龐大。騰訊元寶所產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)，會隨著數(shù)據(jù)量的增加而變得愈發(fā)復雜、難以理解。相應的，其監(jiān)控難度也隨之升高。

元寶APP的組合與定位

騰訊創(chuàng)始人馬化騰對騰訊元寶是非常認可的，原因在于混元大模型的潛力沒有被完全釋放。在騰訊元寶的發(fā)布會上，騰訊云副總裁、騰訊混元大模型負責人劉煜宏提到一件事情，對于全國12億網(wǎng)民來說，大模型相關的AI應用，滲透率還不足1%。

當然，產(chǎn)品技術力不足是一方面。但是最主要的是原因，那就是大模型這個技術在落地的方式上，還是有待開發(fā)者們思考。而這種來自于模式上的創(chuàng)新，才是真正釋放大模型99%潛力的關鍵所在。

騰訊元寶給出了他們的答卷，雖然不能稱作是完美，不過仍然給人耳目一新的感覺。騰訊元寶是有別于傳統(tǒng)APP的，畢竟擺脫了傳統(tǒng)“點擊”、“滑動”這樣的操作模式，轉(zhuǎn)而成為了“發(fā)號施令”、“言出法隨”式操作。對于這種全新理念的產(chǎn)品，就需要花費一定時間來“培訓”用戶，包括如何讓用戶習慣大模型的思維模式、如何讓用戶養(yǎng)成粘性等等。

就像掃碼支付一樣，用戶不再愿意隨身攜帶現(xiàn)金，而是會想盡辦法保證手機電量充足，這就是微信錢包培養(yǎng)用戶的結(jié)果。如果騰訊元寶在騰訊的地位和微信類似，那么騰訊很可能會開始想辦法來帶領用戶走進大模型時代，進而釋放來自AI大模型那99%的潛力。

來源：數(shù)據(jù)猿

收藏分享

聲明：數(shù)據(jù)猿尊重媒體行業(yè)規(guī)范，相關內(nèi)容都會注明來源與作者；轉(zhuǎn)載我們原創(chuàng)內(nèi)容時，也請務必注明“來源：數(shù)據(jù)猿”與作者名稱，否則將會受到數(shù)據(jù)猿追責。