文心一言,百度的速效救心丸
原創(chuàng) 媛媛 余小魚 | 2023-02-24 09:00
【數(shù)據(jù)猿導讀】 百度計劃將多項主流業(yè)務與文心一言整合。百度為何在此時大肆宣傳文心一言產品?

日前,百度發(fā)布了截至2022年12月31日的第四季度及全年未經審計的財務報告。報告顯示,2022年,百度實現(xiàn)營收1236.75億元。在新冠疫情沖擊宏觀經濟的第四季度,營收330.77億元,歸屬百度的凈利潤53.71億元,百度的經營利潤實現(xiàn)同比增長32%。2022財年,百度實現(xiàn)連續(xù)四個季度業(yè)績超出市場預期。
百度2019-2022年營業(yè)收入來源:同花順
在公布財報的同時,百度也公布了文心一言最新進展,以及對文心一言的布局。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在內部信表示,“AI技術已經發(fā)展到一個臨界點,各行各業(yè)都不可避免地被改變。中國AI市場即將迎來爆發(fā)性的需求增長,其商業(yè)價值的釋放將是前所未有的、指數(shù)級的。而百度作為中國人工智能市場長期增長的最佳代表,正站在浪潮之巔。”
并且,百度計劃將多項主流業(yè)務與文心一言整合。百度為何在此時大肆宣傳文心一言產品?
押注AI時代,文心一言開啟“狂飆”模式
百度押注人工智能多年。曾在2016年,李彥宏便提出“互聯(lián)網(wǎng)的下一幕就是人工智能”,隨后便確定了“夯實移動生態(tài),決勝AI時代”的核心戰(zhàn)略。百度智能云便是該戰(zhàn)略的重要載體。在2023年2月13日,百度官方更是推出 “文心一言”,并表示其將于3月和大家正式見面。
據(jù)悉,百度已建立包括底層的芯片、深度學習框架、大模型以及最上層應用的全棧布局,文心一言正是基于百度文心大模型家族研發(fā)。2月17日,百度智能云宣布大語言模型文心一言將通過百度智能云對外提供服務。不僅如此,在內部信中,李宏彥還表示,文心一言還將與諸多主流業(yè)務相結合,包括搜索、智能云、Apollo自動駕駛、小度智能設備等。
文心一言與搜索整合,重塑信息的呈現(xiàn)方式,優(yōu)化搜索排名等。文心一言大模型接入自動駕駛,加深車輛對于復雜道路的理解,提高自動駕駛安全性。除此之外,文心一言還將與小度進行集成。
不僅百度內部諸多業(yè)務與文心一言相結合,據(jù)了解,截至2月16日累計已有100家企業(yè)宣布接入文心一言,其中包括愛奇藝、集度汽車、金蝶軟件、攜程、上海報業(yè)、聯(lián)想等。
部分宣布接入文心一言的企業(yè)
百度在AI領域一直是行業(yè)內的領軍者之一,從語音識別、自然語言處理到計算機視覺等方向都有著廣泛的應用和技術積累。但是,在AI領域的競爭也異常激烈,各大巨頭紛紛布局,加大研發(fā)投入。尤其是在自然語言處理領域,像OpenAI、Google等國外企業(yè)也在不斷推出各種基于深度學習技術的NLP產品,市場潛力巨大。
百度突然宣布All in 文心一言,是因為該產品對于百度在AI領域未來的發(fā)展至關重要。當前,NLP技術正處于爆發(fā)期,市場前景非常廣闊。百度文心一言作為百度在NLP領域的重要產品,將有望引領未來的市場趨勢。而且,百度對于文心一言的投入和重視,也反映了其對于這個產品商業(yè)價值的預期和信心。
此外,文心一言的技術壁壘相對較高,目前也沒有類似的產品在市場上有大規(guī)模的普及和使用,因此百度在這個領域有著相對的優(yōu)勢。文心一言的推廣和應用,也將有望在未來進一步提高百度在NLP領域的地位和競爭力。
當然,百度在文心一言上的投入和All in也存在一定的風險和挑戰(zhàn)。目前,NLP領域的競爭異常激烈,不僅有國內的競爭對手如阿里、騰訊等,還有國外巨頭的競爭。同時,NLP技術本身也存在一些技術難點和局限性,如多語種處理、真實語境下的語義理解等。因此,百度需要不斷地進行技術研發(fā)和創(chuàng)新,以提高產品的競爭力和應用價值。
總之,百度All in 文心一言是百度在AI領域未來發(fā)展的重要舉措,有望引領未來市場趨勢,提高在NLP領域的競爭力和地位。但同時也需要面對激烈的市場競爭和技術難點等挑戰(zhàn)。
追熱點,百度在行
求生的欲望比什么都強大,它可以推動人們走出死亡的陰影,而即使是在絕境之中,我們也不應該停止尋找生存的希望。這句話用來描述百度目前的境況再適合不過了。
2月7日,百度公布將于3月發(fā)布新產品“文心一言”,英文名ERNIE Bot,消息當天,港股股價在一天內大漲15%,美股股價漲幅也達到了12%。
其實,說到底,文心一言就是百度看到ChatGPT火起來后,打造的同類型產品。2022年OpenAI推出ChatGPT,數(shù)百萬人免費使用,很快人們就開始討論,這種新穎的自動文本生成形式會怎樣影響教育、工作,當然還包括谷歌發(fā)家業(yè)務搜索引擎的未來。
用易觀智慧院分析師陳一墨的話說,“ChatGPT大火,是因為它對語義的精準‘理解’,實際表現(xiàn)也被大眾承認,可以進一步解放生產力”。回頭看搜索引擎,也是理解-反饋的過程,雖然現(xiàn)在搜索引擎給出的反饋已經不限于文字、視頻、圖片,但網(wǎng)友對一些抽象概念具體化、更有創(chuàng)造力的反饋需求正在增長。
與此同時,國內互聯(lián)網(wǎng)大廠們也都感受到了來自ChatGPT的沖擊和機遇,紛紛開始布局。那么,這類產品作用到的主要技術有哪些?其他企業(yè)能否快速實現(xiàn)文心一言或ChatGPT目前的高度,甚至超越他們呢?
從技術端來看,文心一言、ChatGPT類產品均是基于生成式AI的大語言類模型。具體來看,這類模型中所需要的技術主要以下幾類:
1、Transformer模型:Transformer模型是一種基于自注意力機制的序列模型,可以處理輸入序列中的不同位置之間的依賴關系。該模型在機器翻譯、對話生成、文章摘要等任務中取得了很好的效果,是文本生成領域中最為流行的模型之一。
2、語言模型:語言模型是一種可以預測下一個單詞或字符的模型,它可以被用來生成文本。在深度學習中,通常使用循環(huán)神經網(wǎng)絡(RNN)或者Transformer模型來建立語言模型。
3、自然語言處理技術:自然語言處理技術是用來處理人類語言的計算機科學領域。該技術包括詞向量表示、詞性標注、命名實體識別、語法分析等等,這些技術可以幫助計算機理解和處理自然語言文本。
4、數(shù)據(jù)集:大規(guī)模、高質量的數(shù)據(jù)集是深度學習中非常重要的資源。對于文本生成任務,例如機器翻譯、對話生成等,需要構建大規(guī)模的平行文本數(shù)據(jù)集,用于模型的訓練和評估。
總的來說,百度文心一言和ChatGPT這類產品所共用的主要技術是深度學習和自然語言處理技術,其技術流程主要包括文本分析、語義理解、情感分析和生成模型等。
其中,文本分析是指對輸入的文本進行分詞、詞性標注、命名實體識別等處理,以便進行后續(xù)的語義理解和情感分析。語義理解則是對分析后的文本進行深度分析,進一步抽象出文本的含義和語義結構,從而生成一個完整的語義表達。情感分析則是對文本的情感進行判斷和分類。最后,生成模型會利用之前的處理結果生成符合要求的文本。
而在主要技術領域,Transformer模型和語言模型是文本生成的核心技術。同時,大規(guī)模、高質量的數(shù)據(jù)集也是文本生成任務中不可或缺的資源。
聚焦國內,百度有話可說
ChatGPT走紅之后,先是在國外刮起了大風,國內大多數(shù)還處于摸索階段。目前,國外關于ChatGPT炒的最熱的便是微軟入股的OpenAI,也就是ChatGPT母公司,其次便是谷歌推出的Bard。
我們將從發(fā)展規(guī)劃、技術應用、參數(shù)規(guī)模、產品布局四方面分析Bard、ChatGPT和文心一言三者的區(qū)別。
從發(fā)展歷程來看,2018年,Open AI在NLP(自然語言處理)領域打造了GPT系列模型。2020年,Open AI放出了具有1750億參數(shù)的預訓練模型GPT-3,橫掃文本生成領域,不僅能問答、翻譯、寫文章,還能做數(shù)學計算。2022年12月,基于GPT-3.5預訓練大模型的免費對話模型——ChatGPT正式上線。而文心一言最早可以追溯到2019年,百度推出了產業(yè)級知識增強文心大模型ERNIE。百度放出的AIGC能力,包括寫作、繪畫、寫歌等方面的能力,都是基于這一大模型。據(jù)推測,去年9月,百度就開始做文心一言,從項目發(fā)起時間來看,并沒有落后Open AI很長時間。谷歌則在ChatGPT火爆后,很快宣布推出競品Bard。然而,該產品首次發(fā)布時就出現(xiàn)了問題。在演示過程中,對于一個關于太空方面的問題,給出了錯誤答案。Bard首秀“翻車”,加劇了外界對谷歌人工智能產品能力的質疑,公司股價隨即大跌。
從技術應用方面來看,ChatGPT成功的原因有四點:強大的基座模型能力(InstructGPT)、大參數(shù)語言模型(GPT3.5)、高質量的真實數(shù)據(jù)(精標的多輪對話數(shù)據(jù)和比較排序數(shù)據(jù))、性能穩(wěn)定的強化學習算法(PPO算法)。百度同樣具備這些能力。百度在人工智能四層架構中,有全棧布局。包括底層的芯片、深度學習框架、大模型以及最上層的搜索等應用。另外,深耕人工智能領域多年的百度,擁有產業(yè)級知識增強文心大模型ERNIE,具備跨模態(tài)、跨語言的深度語義理解與生成能力。在模型應用方面,谷歌曾擁有先發(fā)優(yōu)勢。比如說2017年6月,谷歌發(fā)布Transformer,這個自然語言處理模型非常重要,成為了后來所有大型語言模型LLM的所有基礎架構,ChatGPT中的T就是Transformer這個模型的縮寫。同時在2017年,谷歌的DeepMind就提出了RLHF的方法。這個詞是不是很熟悉,沒錯,就是我們之前提到的,ChatGPT這次加入的強化學習方法,Reinforce Learning with Human Feedback,利用人類反饋信號直接優(yōu)化語言模型。簡而言之,沒有谷歌的Transformer和RLHF,OpenAI不會這么快做起來。
從參數(shù)規(guī)模來看,Bard 基于谷歌 LaMDA 模型,表現(xiàn)已接近人類水平。LaMDA 同樣以 transformer 模型為基礎,預訓練數(shù)據(jù)庫由 1.56 萬億個單詞的文檔和對話構成,參數(shù)量最高達 1370 億,是 GPT-3 的 7.8 倍。文心一言預計將建立在全球最大中文單體預訓練模型 ERNIE 3.0 Titan 之上。2021年12月,百度與鵬城自然語言處理聯(lián)合實驗室發(fā)布全球首個知識增強的千億 AI 大模型——ERNIE 3.0 Titan。ERNIE 3.0 Titan 擁有 2600 億的參數(shù),參數(shù)量較 GPT-3 的 1750 億多出 48.6%,在復雜知識推理能力上較 GPT-3 提升 8 個百分點。
從產品布局來看,不得不提到的是,文心一言和ChatGPT有不同的側重點,文心一言主要關注文本生成領域,而 ChatGPT 則主要關注自然語言處理和生成領域。在產品應用方面,百度聚焦于國內,以中國用戶為核心的,以滿足中國用戶對交流和溝通的需求。ChatGPT目前尚不能在國內正常使用。
這也點燃了國內大企業(yè)的熱情,阿里、騰訊、字節(jié)、華為、快手、小米等紛紛表態(tài),自家有類ChatGPT的技術或即將推出相關產品。
阿里達摩院表示,正在研發(fā)該類產品,并計劃與釘釘?shù)壬a力工具深度結合。有消息透露,字節(jié)跳動正在布局大模型,在語言和圖像兩種模態(tài)上發(fā)力。與此同時,華為也在跟進,這件事對華為相關方面有很大觸動,公司相關專家第一時間坦承OpenAI所帶來的啟發(fā)。騰訊方面透露,目前在ChatGPT相關方向上已有布局,專項研究也在有序推進。例如,去年4月份,騰訊就對外披露了“混元”AI大模型,一個集計算機視覺、自然語言處理、多模態(tài)內容理解、文案生成、文生視頻等多個方向的超大規(guī)模AI智能模型。
一些人士認為,中外企業(yè)在大模型上的差距正在拉大,對中國企業(yè)能不能在技術商業(yè)上迎頭趕上,有一定疑慮。但以目前聚焦最多、外界給予壓力最大的百度來分析,客觀來講,中國企業(yè)已具備必要條件。
ChatGPT給用戶帶來驚艷的背后是大語言模型的功勞,而訓練大模型主要是三大要素——算法、數(shù)據(jù)和算力。百度、阿里、華為、浪潮都有超大模型的訓練和實戰(zhàn)經驗。
浙江大學國際聯(lián)合商學院數(shù)字經濟與金融創(chuàng)新研究中心聯(lián)席主任盤和林表示,在以ChatGPT為代表的AI領域競爭中,中國與美國總體還存在差距。他認為,面對國外企業(yè)的競爭,國內企業(yè)有兩條思路可迎戰(zhàn)。一條是在算法體驗上追上ChatGPT,因為中文互聯(lián)網(wǎng)和英文互聯(lián)網(wǎng)的差異,中國企業(yè)“成功就有市場”;另一條是和ChatGPT合作開展AIGC(AI Generated Content,指利用人工智能技術來生成內容),通過API(應用程序編程接口)將其作為輔助工具。
商業(yè)化落地是難題
ChatGPT類的應用看似先在消費端展開,但估計最后變現(xiàn)主要靠toB,現(xiàn)在在ChatGPT的刺激下,國內各行業(yè)都動起來了,很可能趟出一條大模型toB路線。然而即使如此,就目前來看,仍存在很多問題。
一是目前的產品,就ChatGPT而言,不允許私有化部署,只能使用微軟提供的API接口。中美在應用部署上的習慣不盡相同,比如美國的很多客戶,包括政府機構都習慣使用公有云,但中國很多大中客戶出于安全等考慮,會要求私有化部署。
二是成本較高,不算運行訓練成本,相關服務的平均價格大約為每次調用2美分。智能客服企業(yè)云蝠智能創(chuàng)始人魏佳星也告訴數(shù)智前線,上個月他們試運行了ChatGPT,感覺“一般場景很難負擔得起”。他分析說,智能客服業(yè)務,每一通電話對客戶的收費才0.12元,利潤在2分錢左右,當這項產品的調用成本降到1分錢人民幣時,行業(yè)里才可能會像用水用電一樣使用起來。
百度亦是如此。根據(jù)目前百度官方的介紹,文心一言已經取得了一定的商業(yè)化落地成效。據(jù)悉,百度文心一言已經為許多媒體、出版社、科研機構、創(chuàng)作者等提供了文本生成方面的技術支持和服務,受到了用戶的廣泛認可和好評。
然而,目前文心一言的商業(yè)化落地還存在一些問題。具體來說,可以從以下幾個方面進行分析:
首先是,產品性能問題:盡管文心一言的技術水平已經處于業(yè)界領先地位,但在使用過程中仍然可能存在一些性能上的問題,例如生成的文本有時候不夠流暢、不夠自然等等,需要不斷改進和優(yōu)化。谷歌推出的Bard在發(fā)布會上出現(xiàn)的問題同樣有可能出現(xiàn)在百度以及后來者身上。不過,隨著預訓練大模型的廣泛應用和升級,準確度和效率會有所改善。
其次,商業(yè)模式問題,目前文心一言主要采用的是技術服務模式,但是這種模式的盈利模式并不十分明確,需要進一步探索和完善。百度可以考慮基于文心一言的技術優(yōu)勢,進一步開拓新的商業(yè)模式和市場機會,例如推出更多針對不同行業(yè)的應用案例和解決方案。
針對以上存在的問題,對于百度文心一言產品的商業(yè)化落地,數(shù)據(jù)猿建議可以從以下兩方面進行優(yōu)化和改進:
其一:不斷優(yōu)化產品性能,提升用戶體驗。百度可以加大技術研發(fā)投入和優(yōu)化力度,不斷提升產品性能和穩(wěn)定性,以提高用戶體驗和滿意度。其二:探索新的商業(yè)模式,開拓更多市場機會。百度可以基于文心一言的技術優(yōu)勢,探索新的商業(yè)模式和市場機會,例如推出定制化的產品解決方案,進一步挖掘不同行業(yè)和用戶的需求,實現(xiàn)更大的商業(yè)價值。
文:媛媛 余小魚 / 數(shù)據(jù)猿
來源:數(shù)據(jù)猿