騰訊元寶,臉上寫的是APP,心里藏的是OS
原創(chuàng) 火焰翼人 | 2024-05-30 20:50
【數(shù)據(jù)猿導讀】 2024年5月30日,騰訊發(fā)布了騰訊元寶APP。本質(zhì)上來說,元寶就是騰訊混元大模型的一個入口,里面各種各樣的功能,比如閱讀圖片、長文本、文生圖等等,其背后的技術驅(qū)動,都來自于混元大模型。

2024年5月30日,騰訊發(fā)布了騰訊元寶APP。本質(zhì)上來說,元寶就是騰訊混元大模型的一個入口,里面各種各樣的功能,比如閱讀圖片、長文本、文生圖等等,其背后的技術驅(qū)動,都來自于混元大模型。
具體來講,在AI 搜索方面,騰訊元寶接入了微信搜一搜、搜狗搜索等搜索引擎,并通過AI搜索增強,提升時新類和知識類問題效果,比傳統(tǒng)搜索更有效率;同時,內(nèi)容覆蓋微信公眾號等騰訊生態(tài)內(nèi)容及互聯(lián)網(wǎng)權威信源,答案準確性更高;此外,元寶還會提供所引用的參考資料,并給出相關推薦,方便快速溯源及延伸閱讀。
在AI總結(jié)方面,元寶可上傳最多10個PDF、word、txt等多種格式的文檔,并能夠一次性解析多個微信公眾號鏈接、網(wǎng)址,支持256K的原生窗口上下文,相當于一本《三國演義》,或是英文原版的《哈利波特》全集。
在AI寫作方面,元寶不僅支持多輪問答,還能夠?qū)υ挼膬?nèi)容整理成報告,按照要求進行結(jié)構(gòu)化輸出,大大提升信息從獲取到處理再到生產(chǎn)的效率。除此之外,騰訊元寶還有很多花哨的玩法。比如圖生圖、口譯翻譯等等。
騰訊的優(yōu)勢在于C端
騰訊元寶的內(nèi)在邏輯是,騰訊通過一系列APP產(chǎn)品,比如微信、QQ,發(fā)掘用戶的需求。再把這些需求交給混元大模型上,一旦混元能夠解決這個需求,那就把這個功能入口加進元寶里。因此,騰訊元寶本質(zhì)上不少“一個”APP,而是“一群”APP。
目前看來,各廠商大模型沒辦法在性能上拉開比較明顯的差距,價格和實用性就成了新戰(zhàn)場。騰訊此前在移動互聯(lián)網(wǎng)時代的積累,隨著混元大模型性能的開發(fā)和提升而得到釋放,造就了今天的騰訊元寶。
不過,騰訊元寶的入口越多,它就越不像一個APP,而是像一個“OS”。事實上,騰訊也有類似的想法,把騰訊元寶變成一個“超級入口”,通過文字和語音,調(diào)用所有的功能。
騰訊想要把AIOS的理念通過騰訊元寶和混元大模型來變成現(xiàn)實。AIOS最早是在2023年12月時提出的,這是一個基于大語言模型的操作系統(tǒng)。在指令理解、信息處理、決策判斷等方面都能實現(xiàn)自主狀態(tài),無需人為干預即可獨立執(zhí)行任務。
然而AIOS的缺點是很明顯的,首先,AIOS通常需要大量計算資源來運行,對硬件要求較高,影響設備的能源效率和成本效益。如果元寶變成了OS,它將應用在手機上,那么其計算資源消耗的程度是很夸張的。
其次,與傳統(tǒng)編程語言相比,自然語言指令的非結(jié)構(gòu)化和模糊性可能使代理應用程序的代碼掃描、調(diào)試和維護變得更加困難。同時,AIOS是允許使用自然語言作為編程接口的,這可能導致安全性和隱私保護的復雜性增加。自然語言的開放性和模糊性可能被惡意利用,使得系統(tǒng)的安全性成為一個重大挑戰(zhàn)。
最后,由于AIOS基于大語言模型,那么它的系統(tǒng)維護就會相對復雜,尤其是在處理多代理交互、動態(tài)任務生成與執(zhí)行方面。
AIOS是騰訊元寶的老前輩了??墒且?ldquo;APP”變成一個“OS”,需要克服的問題遠不止于此。以往,騰訊獲得驗證的方式都來自于APP,現(xiàn)在,他們需要一個來自于OS的驗證方式。最好是自帶標注的訓練數(shù)據(jù),不過這收集起來有些繁瑣,成本非常高。
大模型比的還是微調(diào)
在Hugging Face上優(yōu)秀的大模型數(shù)不勝數(shù),比如Llama 3、Zypher等等。但是真正使用起來就會發(fā)現(xiàn),這些頂尖大模型不僅沒辦法生成有用的信息,也時常答非所問。這是由于大模型從開發(fā)到使用之間,需要對其進行“微調(diào)”,才能確保生成的內(nèi)容能夠為用戶所用。
微調(diào)的核心思想是利用預訓練模型的已有知識來加速和優(yōu)化新任務的學習過程。具體體現(xiàn)在,當用戶說出特定關鍵詞時,模型會回答預先訓練好的結(jié)果。比如問元寶APP,“你是用什么模型訓練的”,騰訊元寶并不會如實回答,畢竟訓練和推理的過程對于騰訊這樣的開發(fā)者來說,無疑是寶貴的財富,目前還沒有到完全開源的地步。
大模型的實戰(zhàn)能力,某種程度上來說,也等于是開發(fā)團隊對其微調(diào)的具象化表現(xiàn)。因為大模型跟通信技術不一樣,沒有像是3GPP這樣的組織,進而不存在某一個數(shù)據(jù)集是大家公認的,只有部分認可的數(shù)據(jù)集。哪怕是最近因為OpenAI而熱度很高的LMSYS,也不是所有從業(yè)者都認可它的驗證標準。
但是用戶的眼睛是雪亮的,哪家大模型微調(diào)的出色,一眼便知。其中道理很簡單,用戶的評判標準在于大模型的回答是否解決了其問題所在。
騰訊元寶的下一步將會是繼續(xù)微調(diào)。因為騰訊元寶成為了新的入口,其所能得到的需求可能和以往入口是完全不相同的。
針對新的任務需求,就需要對預訓練模型的結(jié)構(gòu)進行調(diào)整。這通常涉及到保留模型的大部分層不變,尤其是那些學習到通用特征的底層,同時根據(jù)新任務的輸出類型添加或修改輸出層。例如,如果原始模型用于1000類分類,而新任務只有10類,就需要替換或調(diào)整最后的全連接層以匹配新類別的數(shù)量。
而在微調(diào)過程中,還需要持續(xù)監(jiān)控模型的性能,如準確率、損失函數(shù)等指標,以確保模型沒有過擬合,并且在驗證集上的表現(xiàn)有所提升。這對于騰訊來說其實是有些頭疼的,這是因為騰訊C端入口的數(shù)據(jù)量比較龐大。騰訊元寶所產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù),會隨著數(shù)據(jù)量的增加而變得愈發(fā)復雜、難以理解。相應的,其監(jiān)控難度也隨之升高。
元寶APP的組合與定位
騰訊創(chuàng)始人馬化騰對騰訊元寶是非常認可的,原因在于混元大模型的潛力沒有被完全釋放。在騰訊元寶的發(fā)布會上,騰訊云副總裁、騰訊混元大模型負責人劉煜宏提到一件事情,對于全國12億網(wǎng)民來說,大模型相關的AI應用,滲透率還不足1%。
當然,產(chǎn)品技術力不足是一方面。但是最主要的是原因,那就是大模型這個技術在落地的方式上,還是有待開發(fā)者們思考。而這種來自于模式上的創(chuàng)新,才是真正釋放大模型99%潛力的關鍵所在。
騰訊元寶給出了他們的答卷,雖然不能稱作是完美,不過仍然給人耳目一新的感覺。騰訊元寶是有別于傳統(tǒng)APP的,畢竟擺脫了傳統(tǒng)“點擊”、“滑動”這樣的操作模式,轉(zhuǎn)而成為了“發(fā)號施令”、“言出法隨”式操作。對于這種全新理念的產(chǎn)品,就需要花費一定時間來“培訓”用戶,包括如何讓用戶習慣大模型的思維模式、如何讓用戶養(yǎng)成粘性等等。
就像掃碼支付一樣,用戶不再愿意隨身攜帶現(xiàn)金,而是會想盡辦法保證手機電量充足,這就是微信錢包培養(yǎng)用戶的結(jié)果。如果騰訊元寶在騰訊的地位和微信類似,那么騰訊很可能會開始想辦法來帶領用戶走進大模型時代,進而釋放來自AI大模型那99%的潛力。
來源:數(shù)據(jù)猿
刷新相關文章
我要評論
不容錯過的資訊
-
1《2024中國AI大模型產(chǎn)業(yè)圖譜1.0版》重磅
-
2喜訊|預策科技獲得阿里巴巴前參謀長曾鳴
-
3《2024中國數(shù)據(jù)要素產(chǎn)業(yè)圖譜1.0版》重磅
-
4CBDT 2024第二屆中國出海品牌數(shù)字科技峰
-
5字節(jié)AI Bot扣子底層已接入通義千問、Min
-
6中國石油、中國移動、華為、科大訊飛共建
-
7《2024中國企業(yè)數(shù)智化轉(zhuǎn)型升級服務全景圖
-
8內(nèi)容與出海,熱點創(chuàng)造焦點——2024虎嘯盛
-
9馬斯克計劃推出xAI超級計算機;中國移動
-
10Huasheng Tiancheng officially join
大數(shù)據(jù)企業(yè)推薦more >
大家都在搜
