阿里CEO吳泳銘:生成式AI讓世界有了一個統(tǒng)一的語言——Token
原創(chuàng) 一蓑煙雨 | 2024-09-20 21:54
【數(shù)據(jù)猿導(dǎo)讀】 阿里CEO吳泳銘:生成式AI讓世界有了一個統(tǒng)一的語言——Token

筆者參加了幾屆阿里云棲大會,每一屆都有不同的主題。但近兩屆,有一個越來越明晰的主線,那就是云與AI的融合。
這一屆的阿里云棲大會,無論是從主題演講還是展覽設(shè)置,這種云+AI的感覺都很強(qiáng)。在阿里巴巴的高層中,吳泳銘作為技術(shù)派,對AI更是情有獨(dú)鐘。他主導(dǎo)阿里之后,從各條業(yè)務(wù)線,都能明顯的看到AI化的痕跡。
其中,阿里云是承擔(dān)整個阿里集團(tuán)AI夢想的基石和載體。吳泳銘在擔(dān)任阿里巴巴集團(tuán)CEO的同時,還兼任阿里云智能集團(tuán)董事長、CEO,可見其對于云業(yè)務(wù)的重視。
我一直以為,決定一個公司發(fā)展高度的,不在于在某個技術(shù)或者產(chǎn)品上的一時領(lǐng)先,而在于高層尤其是“話事人”的認(rèn)知,他如何看待這件事情,才是決定事情走向的最關(guān)鍵變量。一旦認(rèn)知和決心到位了,就會有一系列的行動,那資源、人才、資金自然會聚集,隨之而來的技術(shù)產(chǎn)品創(chuàng)新,就是水到渠成的事情?;叵氘?dāng)初,阿里巴巴在幾家頭部互聯(lián)網(wǎng)公司中,也不是技術(shù)基因最強(qiáng)的,為什么云計算做的最好?馬云當(dāng)初的決絕和堅持,起到了關(guān)鍵作用。
所以,這一屆阿里云棲大會,我最關(guān)心的不是阿里云又發(fā)布了什么產(chǎn)品,而是其“話事人”如何看待云和AI這件事情。
在上午的主論壇上,關(guān)于AI和云,吳泳銘說了不少很新穎的觀點。其中,有一個觀點挺有趣:生成式AI讓世界有了一個統(tǒng)一的語言——Token。AI模型可以通過對物理世界數(shù)據(jù)的Token化,理解真實世界的方方面面。理解之后,AI就可以模仿人類去執(zhí)行物理世界的任務(wù),這將帶來新的產(chǎn)業(yè)革命。
接下來,我們試圖就這一觀點來進(jìn)行分析探討。
信息世界的“巴別塔”,為什么AI至今無法通曉萬物?
語言,是信息傳遞的基礎(chǔ)。它不僅是人與人之間溝通的橋梁,更是技術(shù)世界中信息流通的核心。在人類社會中,語言承載了思想、文化和知識的傳遞。在技術(shù)領(lǐng)域,語言的作用更為關(guān)鍵——它是指令、數(shù)據(jù)、算法的表達(dá)形式,是所有信息交互的根本。
尤其在AI領(lǐng)域,語言的重要性愈發(fā)凸顯。AI通過自然語言處理來理解和生成文本,通過代碼語言來執(zhí)行任務(wù),通過視覺語言來識別和處理圖像。這些不同的“語言”構(gòu)成了AI理解世界的多種維度。然而,這些語言之間的割裂,成為了AI發(fā)展的最大障礙。
當(dāng)前的數(shù)字化世界,信息以多種模態(tài)存在——自然語言、程序代碼、圖像、視頻、音頻、3D模型、數(shù)學(xué)符號……這些信息形式各自獨(dú)立,彼此之間的“對話”幾乎不存在。AI雖然能夠在單一模態(tài)下表現(xiàn)出色,但面對多模態(tài)信息時,卻往往顯得力不從心。
這種割裂,不僅增加了技術(shù)開發(fā)的復(fù)雜性,也極大限制了AI的智能表現(xiàn)。我們可以想象,一個AI能夠精通各自獨(dú)立的“語言”,但當(dāng)這些語言需要被整合時,AI就如同陷入了信息的“巴別塔”,難以將所有信息串聯(lián)起來,形成全面的理解。
這種多模態(tài)割裂直接導(dǎo)致了技術(shù)發(fā)展的瓶頸。以自動駕駛為例,自動駕駛汽車需要整合多種傳感器的數(shù)據(jù),如攝像頭捕捉的視覺信息、雷達(dá)提供的距離測量、GPS帶來的定位數(shù)據(jù)等。這些數(shù)據(jù)形式各不相同,處理它們的難度非常大。盡管每一種傳感器的單獨(dú)表現(xiàn)都很優(yōu)異,但當(dāng)所有數(shù)據(jù)需要整合成一個統(tǒng)一的駕駛決策時,AI常常會出現(xiàn)延遲、誤判,甚至失效的情況。
在醫(yī)療領(lǐng)域,醫(yī)生常常需要結(jié)合影像數(shù)據(jù)、化驗報告、病歷記錄等多模態(tài)信息來做出診斷決策。AI在這些單一領(lǐng)域內(nèi)表現(xiàn)優(yōu)異,但在將這些多模態(tài)數(shù)據(jù)整合為一個全面的診斷模型時,依舊存在巨大挑戰(zhàn)。多模態(tài)數(shù)據(jù)之間缺乏統(tǒng)一的表達(dá)方式,導(dǎo)致AI難以在復(fù)雜的診療場景中發(fā)揮出應(yīng)有的智能水平。
要讓AI突破這些限制,實現(xiàn)從“聰明”到“通曉”的進(jìn)化,就必須有一種能夠跨越各種信息形式的通用語言。這樣的語言可以將不同模態(tài)的信息標(biāo)準(zhǔn)化、統(tǒng)一化,使AI能夠在處理多模態(tài)信息時不再受制于割裂,而是能夠像人類一樣,自由地整合和應(yīng)用各種信息。
這個通用語言的出現(xiàn),不僅將為AI帶來更強(qiáng)的理解力和適應(yīng)力,也將為技術(shù)開發(fā)者帶來更大的自由度和創(chuàng)造力。AI將不再被困在“巴別塔”中,而是能夠在一個統(tǒng)一的語言環(huán)境中,真正展現(xiàn)出全面的智能。
這一切,都為Token的出現(xiàn)提供了廣闊的舞臺。那么,Token,作為信息世界的通用語言,將如何打破這些壁壘,成為AI的全新“語言”工具?
Token來了:AI終于找到了一種語言,它能“聽懂”一切!
Token是信息世界的基本單位,類似于語言中的單詞或語法結(jié)構(gòu),但其功能遠(yuǎn)超普通符號。它不僅是信息的最小表達(dá)單元,更是多模態(tài)信息處理的核心工具,能夠?qū)⑽淖?、圖片、視頻、語音等不同形式的信息標(biāo)準(zhǔn)化為統(tǒng)一的符號系統(tǒng)。這一標(biāo)準(zhǔn)化過程使得AI能夠跨越模態(tài)邊界,實現(xiàn)統(tǒng)一處理,進(jìn)而在更復(fù)雜的任務(wù)中表現(xiàn)出色。
技術(shù)上,Token的生成過程包括將原始數(shù)據(jù)分割成最小的信息片段,這些片段可以是單詞、圖像的像素塊、音頻的片段等。這些片段通過編碼過程被轉(zhuǎn)化為固定長度的向量,代表了信息在AI模型中的特征。解碼過程則將這些向量重新轉(zhuǎn)換為可供人類理解的形式,比如文字、圖片或聲音。通過Token的編碼和解碼,AI可以在不同信息模態(tài)之間進(jìn)行流暢的轉(zhuǎn)換和整合。
以阿里巴巴的最新多模態(tài)大模型通義千問為例。在此次云棲大會上,阿里云的通義千問展示了最新的文生視頻功能。至此,通義千問進(jìn)化為一個集成了文本、圖像、視頻和語音處理能力的大模型,它展示了Token技術(shù)在跨模態(tài)信息處理中的應(yīng)用。
舉個具體的例子,假設(shè)你輸入“中國風(fēng)的小兔子,身著精致的唐裝”,通義千問能夠生成一段包含這些元素的視頻。在這個過程中,通義千問將輸入的文本內(nèi)容首先分解為文本Token,然后將這些Token映射到一個語義空間中,生成相應(yīng)的視覺。
可以說,Token的出現(xiàn),為信息處理帶來了革命性變化。它如同中國古代的“書同文、車同軌”,通過統(tǒng)一標(biāo)準(zhǔn),使得原本各自為營的信息模態(tài)可以在同一個語義層次上互相交流。過去,AI只能在單一模態(tài)中發(fā)揮作用,而通過Token,AI實現(xiàn)了跨模態(tài)的信息整合,打破了原有的技術(shù)壁壘。
這種跨模態(tài)能力,使得AI在信息融合、理解和生成上的表現(xiàn)大幅提升,推動了人工智能從單一智能向全面智能的進(jìn)化。
Token的商用化路徑,云計算如何成為關(guān)鍵推手?
Token技術(shù),雖然在理論和實驗室環(huán)境中展現(xiàn)了巨大的潛力,但將其推向大規(guī)模商用并非易事。一個顯著的挑戰(zhàn)就是其高昂的計算和處理成本。
Token的處理,涉及海量的數(shù)據(jù)分割、編碼、解碼以及跨模態(tài)的信息融合。這些操作需要強(qiáng)大的計算能力和極高的資源消耗。特別是在面對復(fù)雜的多模態(tài)任務(wù)時,AI模型需要處理數(shù)以百萬計的Token,這對計算資源提出了嚴(yán)苛的要求。傳統(tǒng)的計算架構(gòu)在應(yīng)對這種大規(guī)模需求時,往往捉襟見肘,無法提供足夠的計算能力和處理效率。
此外,Token的實際部署還涉及數(shù)據(jù)的實時處理和大規(guī)模分布式計算。無論是在自然語言處理、圖像識別,還是在視頻生成等應(yīng)用中,Token化的過程都需要高速且穩(wěn)定的計算資源。然而,現(xiàn)有的計算資源體系結(jié)構(gòu),尤其是在面臨大規(guī)模并行任務(wù)時,常常無法高效應(yīng)對。這導(dǎo)致了Token技術(shù)在商用化過程中遇到的瓶頸,嚴(yán)重制約了其在更廣泛領(lǐng)域的應(yīng)用。
解決Token商用化挑戰(zhàn)的關(guān)鍵,正是在于云計算的技術(shù)推動。云計算通過其獨(dú)特的優(yōu)勢,為Token的廣泛應(yīng)用提供了強(qiáng)有力的支撐。
例如,阿里云的分布式計算架構(gòu)允許AI模型在多個節(jié)點上并行處理Token任務(wù),極大地提高了計算效率。在數(shù)據(jù)存儲方面,阿里云通過優(yōu)化存儲架構(gòu),使得Token化過程中產(chǎn)生的大量數(shù)據(jù)能夠被快速讀寫和存取,減少了數(shù)據(jù)處理的延遲。此外,阿里云還通過智能調(diào)度算法優(yōu)化了計算資源的分配,使得計算任務(wù)能夠在最短時間內(nèi)完成,同時最大限度地降低資源浪費(fèi)。
阿里云在降低AI成本方面取得了卓越的成績,尤其體現(xiàn)在通義千問推薦模型的價格調(diào)整上。最新數(shù)據(jù)顯示,通義千問系列模型的價格降幅高達(dá)85%,這是一個極具競爭力的調(diào)整。具體來看,QwenPlus模型的價格降至0.0008元/千Token,QwenTurbo的價格則為0.0003元/千Token。
此外,阿里云還推出了新用戶福利——5000萬免費(fèi)試用Token和4500張圖像生成權(quán)限。這些優(yōu)惠措施不僅降低了企業(yè)在AI應(yīng)用中的前期投入,還顯著提升了用戶的體驗和接觸AI技術(shù)的機(jī)會。結(jié)合阿里云在推理輸入方面的優(yōu)化,這些降價和優(yōu)惠策略大大減輕了企業(yè)在AI應(yīng)用中的成本壓力,使得高性能AI模型的普及成為可能。
通過云計算的支持,Token技術(shù)不再局限于實驗室或小規(guī)模應(yīng)用,而是能夠在更大范圍內(nèi)進(jìn)行推廣和部署。這種協(xié)同效應(yīng)不僅解決了Token商用中的瓶頸問題,還帶來了更高效、更經(jīng)濟(jì)的AI部署模式。企業(yè)能夠以更低的成本、更高的效率,利用Token技術(shù)實現(xiàn)智能化轉(zhuǎn)型,從而在市場競爭中占據(jù)優(yōu)勢。
技術(shù)突破之后,如何讓Token走向商用前線?
展望未來,隨著大模型與云計算的深度融合,AI的應(yīng)用前景變得更加廣闊,潛力無窮。正如阿里巴巴CEO吳泳銘在2024年云棲大會上指出,AI的最大想象力并非局限于創(chuàng)造新的移動應(yīng)用,而在于徹底重塑物理世界。
這一變革的核心驅(qū)動力正是生成式AI與Token技術(shù)的結(jié)合,Token作為信息世界的“通用語言”,能夠?qū)⑽淖?、圖像、視頻、聲音等多模態(tài)信息統(tǒng)一處理,使AI不僅能夠理解復(fù)雜的數(shù)據(jù),還能夠模仿人類行為,執(zhí)行各種任務(wù)。這種能力將為AI在各行業(yè)中的應(yīng)用開辟廣闊的空間。
同時,隨著先進(jìn)AI模型的開發(fā)成本不斷攀升,達(dá)到數(shù)十億甚至數(shù)百億美元,云計算的重要性愈發(fā)突出。阿里云這樣的云廠商,憑借其強(qiáng)大的算力基礎(chǔ)設(shè)施,正在為這一趨勢提供必要的支持。
未來,云計算架構(gòu)將從以CPU為主轉(zhuǎn)向以GPU為主的AI計算體系,滿足AI日益增長的算力需求。這種計算體系的轉(zhuǎn)變,不僅將大幅降低AI應(yīng)用的成本,還將加速AI在各行業(yè)的廣泛滲透。
例如,在AI大模型的支持下,未來所有能夠移動的物體都可能成為智能機(jī)器人——從工廠中的機(jī)械臂到家庭中的助理機(jī)器人,AI將無處不在。工廠將由智能機(jī)器人主導(dǎo),生產(chǎn)效率將大幅提升;家庭生活也將因智能機(jī)器人的加入變得更加便利和高效。
當(dāng)然,這種變革的影響不僅局限于機(jī)器人領(lǐng)域。隨著AI驅(qū)動的數(shù)字世界與具備AI能力的物理世界的深度融合,全球生產(chǎn)力將迎來一次革命性的提升。無論是自動駕駛、智能醫(yī)療設(shè)備,還是金融風(fēng)險管理系統(tǒng),AI將成為推動各行業(yè)發(fā)展的核心力量。
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評論
不容錯過的資訊
-
1第十四屆智慧城市與智能經(jīng)濟(jì)博覽會 倒計
-
2透過財報看京東云:新勢力崛起,京東如何
-
3“數(shù)智軟件 提升新質(zhì)”——2024中國軟件
-
4上海交通大學(xué)教授沈為:校企聯(lián)合,打造大
-
5我們的《黑神話:悟空》,應(yīng)該由自己的網(wǎng)
-
6夸克發(fā)布全新 CueMe 智能對話助手;消
-
7用友網(wǎng)絡(luò)發(fā)布半年報:距離晴天還有多久?
-
82024中國智能制造領(lǐng)域最具商業(yè)合作價值企
-
9金蝶2024上半年營收穩(wěn)增虧損收窄,云服務(wù)
-
10商湯科技2024半年財報深度解析:降本增效
大數(shù)據(jù)企業(yè)推薦more >
大家都在搜
