ChatGPT +RPA=?——對話ALBERT藍振忠&實在智能孫林君
【數(shù)據(jù)猿導(dǎo)讀】 ChatGPT到底有什么“魅力”,它只是一陣科技旋風(fēng),還是有長久的價值?該如何將ChatGPT看似高大上的技術(shù)落地到實際的應(yīng)用場景中?ChatGPT該如何走進B端的企業(yè)服務(wù)領(lǐng)域,真正成為生產(chǎn)力?帶著這些問題,數(shù)據(jù)猿對實在智能創(chuàng)始人&CEO孫林君、ALBERT模型第一作者藍振忠博士進行了聯(lián)合專訪,...

如果要問目前科技界最火的話題是什么,很多人的答案將是ChatGPT。而且,ChatGPT大有“破圈”之勢,不僅業(yè)界人士在關(guān)注,各行各業(yè)的普通人也在大量討論。
那么,ChatGPT到底有什么“魅力”,它只是一陣科技旋風(fēng),還是有長久的價值?該如何將ChatGPT看似高大上的技術(shù)落地到實際的應(yīng)用場景中?ChatGPT該如何走進B端的企業(yè)服務(wù)領(lǐng)域,真正成為生產(chǎn)力?帶著這些問題,數(shù)據(jù)猿對實在智能創(chuàng)始人&CEO孫林君、ALBERT模型第一作者藍振忠博士進行了聯(lián)合專訪,探討ChatGPT如何應(yīng)用落地,尤其是ChatGPT與RPA結(jié)合的可能性。
ChatGPT是一陣風(fēng)么?
首先,我們來回答第一根問題——ChatGPT到底是一陣很快過去的科技旋風(fēng),還是會產(chǎn)生實際的應(yīng)用價值。要回答這個問題,孫林君提出了一個判斷的標(biāo)準(zhǔn)——ChatGPT的表現(xiàn)是否能夠超過大部分普通人的平均水平。
其實,這條判斷標(biāo)準(zhǔn)適用于整個AI領(lǐng)域,即一項AI技術(shù)是否能夠?qū)崿F(xiàn)應(yīng)用落地,關(guān)鍵的判斷標(biāo)準(zhǔn),是其表現(xiàn)是否超越了人類的平均標(biāo)準(zhǔn),我們暫且將其命名為“人擇定理”。這條定理已經(jīng)在圖像識別和語音識別領(lǐng)域得到驗證,以圖像識別中的人臉識別為例,現(xiàn)在人臉識別已經(jīng)實現(xiàn)了大規(guī)模應(yīng)用,人臉識別解鎖已經(jīng)成為智能手機的標(biāo)配,越來越多的城市攝像頭也具備人臉識別功能。人臉識別之所以能夠?qū)崿F(xiàn)大規(guī)模商用,有一個關(guān)鍵前提,那就是AI在人臉識別準(zhǔn)確率上的表現(xiàn)已經(jīng)超過了人類的平均水平。在大部分場景里,AI系統(tǒng)能夠比人類識別的更準(zhǔn)確、更快速。
同樣的道理,ChatGPT要實現(xiàn)大規(guī)模商用,也必須要滿足一個條件——在對話方面,能夠超越大部分人類的平均水平。
ChatGPT能夠滿足這個條件么?以下是它自己的回答,ChatGPT認為自己能夠處理常見的對話問題,甚至在推理和歸納方面超越了普通人。看來,它對自己的能力還是比較自信的。
當(dāng)然,ChatGPT自己也承認了,其并不具備真正意義上的理解和思考的能力,在創(chuàng)造性方面還比不上人類。但這并不能阻礙ChatGPT的大規(guī)模商用,事實上,不具備人類的理解與思考能力,是目前大部分AI的通病。即使是現(xiàn)在已經(jīng)大規(guī)模商用的圖像識別技術(shù),在圖像理解方面依然不如人類。人類可以理解一幅圖像的背景、語境甚至加入情感因素,而這些是AI做不到的。此外,人類可以很容易地識別模糊、扭曲或變形的圖像,但AI系統(tǒng)卻很難做到這一點。
同樣的,雖然現(xiàn)在ChatGPT依然還存在各種問題,但它能夠在大部分對話場景中表現(xiàn)出超越普通人的平均水準(zhǔn),就已經(jīng)跨過了商用門檻了。
除了ChatGPT的實際應(yīng)用表現(xiàn)以外,其底層技術(shù)的突破也是決定其未來發(fā)展前景的重要基礎(chǔ)。需要指出的是,對話式AI并不是什么新鮮事,而是AI領(lǐng)域的老熟人了。但在很長一段時間內(nèi),對話式AI的表現(xiàn)都差強人意,為什么此次ChatGPT能夠一鳴驚人呢?
每一輪AI的商用突破,都建立在底層技術(shù)進步基礎(chǔ)上。上一輪圖像識別、語音識別的進步,根本在于深度學(xué)習(xí)技術(shù)的突破,而這一輪以ChatGPT為代表的AI浪潮,底層是大規(guī)模預(yù)訓(xùn)練模型的技術(shù)突破。
大規(guī)模預(yù)訓(xùn)練模型,首先表現(xiàn)在模型規(guī)模的“大”,模型的參數(shù)規(guī)模動輒上億,GPT參數(shù)規(guī)模上千億,這是以前的AI模型所無法企及的。除了模型規(guī)模外,超大規(guī)模預(yù)訓(xùn)練模型還在技術(shù)上有多項突破,比如:通過自監(jiān)督學(xué)習(xí),模型可以利用海量的未標(biāo)記數(shù)據(jù)進行訓(xùn)練,從而提高模型的泛化能力。數(shù)據(jù)是影響AI模型表現(xiàn)的重要因素,數(shù)據(jù)量越大、質(zhì)量越高,訓(xùn)練出來的AI模型表現(xiàn)越好。但高質(zhì)量的數(shù)據(jù)是有限的,尤其是以往的訓(xùn)練數(shù)據(jù)集往往需要人工來進行數(shù)據(jù)標(biāo)注,這會耗費大量的人力物力,也成為快速擴大訓(xùn)練數(shù)據(jù)集的重要瓶頸。借助自監(jiān)督學(xué)習(xí),可以用未標(biāo)記的數(shù)據(jù)來訓(xùn)練模型,這極大擴展了訓(xùn)練數(shù)據(jù)集的規(guī)模,解除了數(shù)據(jù)標(biāo)注的“枷鎖”;
其次,建立在大模型基礎(chǔ)上的ChatGPT具備跨語言學(xué)習(xí)的能力。ChatGPT作為美國公司開發(fā)的AI應(yīng)用,獲得了大量中國用戶的青睞,關(guān)鍵的原因就是ChatGPT在中文環(huán)境中依然有良好的表現(xiàn)。其中原因,即ChatGPT具備跨語言學(xué)習(xí)能力,可以利用多種語言的語料庫進行訓(xùn)練,從而提高模型的跨語言泛化能力。
正如藍振忠博士所說,ChatGPT底層的大規(guī)模預(yù)訓(xùn)練模型技術(shù)還處在快速發(fā)展進程中,其未來商用前景是值得期待的。
在應(yīng)用場景探索方面,ChatGPT+RPA可能是一個很有潛力的方向。在孫林君看來,ChatGPT與RPA是相互需要、相互成就的關(guān)系,具體來看:
ChatGPT需要RPA,探索B端應(yīng)用場景
決定AI發(fā)展前景的關(guān)鍵要素有兩個,一個是技術(shù)的成熟度,另一個是應(yīng)用場景落地?,F(xiàn)在AI普遍存在的問題就是“拿著錘子找釘子”,缺少落地場景。
ChatGPT要實現(xiàn)商業(yè)化,應(yīng)用場景也是關(guān)鍵要素。目前ChatGPT的應(yīng)用場景主要是兩個:一個是直接面向C端用戶,提供智能對話服務(wù);另一個是嵌入微軟的搜索引擎,優(yōu)化其搜索服務(wù)。這兩個場景都偏C端,目前在B端企業(yè)服務(wù)領(lǐng)域ChatGPT還缺少典型的應(yīng)用場景。
ChatGPT要落地B端,關(guān)鍵的一步是要接入企業(yè)的業(yè)務(wù)流程,這就進入了RPA熟悉的地盤了。ChatGPT+RPA,也許是ChatGPT攻入B端企業(yè)服務(wù)領(lǐng)域的一個關(guān)鍵入口。同時,借助ChatGPT的能力,RPA能夠提供的流程自動化服務(wù)將更為強大。
接下來,我們以智能客服為例,來暢想一下ChatGPT+RPA的應(yīng)用落地方式。
大體來看,根據(jù)智能客服的智能化程度,可以將其分為三個階段:
純智能客服,系統(tǒng)只能根據(jù)客戶提供的一些關(guān)鍵詞返回一些簡單、標(biāo)準(zhǔn)化的回復(fù),無法涉及復(fù)雜的業(yè)務(wù)流程,不能幫助客戶辦理業(yè)務(wù),解決的問題很有限;
智能客服+RPA,通過RPA將智能客服接入到企業(yè)的業(yè)務(wù)系統(tǒng),不再局限于簡單的回復(fù)客戶問題,還能幫助客戶調(diào)取對應(yīng)的業(yè)務(wù)流程,幫助客戶辦理部分業(yè)務(wù),讓智能客服系統(tǒng)的價值提升了一個量級。但是,智能客服系統(tǒng)對人類語言的理解能力有限,還是通過抓取人類語言中的關(guān)鍵詞的方式,來調(diào)取對應(yīng)的業(yè)務(wù)系統(tǒng)。這要求客戶在跟系統(tǒng)交互時,要使用規(guī)范、簡單的語言,智能客服系統(tǒng)才能理解。而對于一個復(fù)雜的業(yè)務(wù)需求,往往需要一大段語言才能描述清楚,這種情況智能客服系統(tǒng)往往無能為力,只能讓人工客服介入。
智能客服+RPA+ChatGPT,借助ChatGPT強大的自然語言理解能力,可以實現(xiàn)多方面的提升。
以下,是我們用ChatGPT模擬的一個電信套餐辦理的智能客服場景。
從這個場景中,可以發(fā)現(xiàn),借助ChatGPT的能力,智能客服系統(tǒng)將在以下三個方面獲得顯著提升:
復(fù)雜需求的理解,智能客服系統(tǒng)不再只能識別一些關(guān)鍵詞,而是可以從一大段話中理解客戶的真實需求??蛻舨辉訇P(guān)心自己要怎樣說才能讓系統(tǒng)“聽得懂”,而可以像面對人工客服一樣,按照自己的邏輯把需求講述出來;
多輪對話,以往的對話式AI之所以被廣為詬病,一個重要原因就是缺乏多輪對話能力,不能聯(lián)系上下文來理解人類語境。在智能客服這個場景中,復(fù)雜的業(yè)務(wù)需求,往往一次對話是不能解決的,需要多次對話才行。ChatGPT部分解決了這個問題,客戶可以通過多輪對話的方式,一步步解決一個復(fù)雜的問題,或者辦理一個復(fù)雜的業(yè)務(wù);
結(jié)構(gòu)化回復(fù)內(nèi)容的生成,以往的智能客服系統(tǒng)往往只能給出一個簡單的回復(fù),或者返回簡單的業(yè)務(wù)鏈接。借助ChatGPT的內(nèi)容生成能力,智能客服系統(tǒng)可以基于客戶需求返回一個結(jié)構(gòu)化的解決方案,這個方案可以針對性的解決客戶復(fù)雜的業(yè)務(wù)需求。
在上述場景中,如果要介入真實的業(yè)務(wù)流程,ChatGPT+RPA就是最好的方式,ChatGPT在智能客服終端與用戶進行自然交互,RPA在后端調(diào)用需要的業(yè)務(wù)流程,進行流程自動化辦理,并將結(jié)果交給ChatGPT,讓其以便于理解的解決方案方式呈現(xiàn)給用戶。
對ChatGPT而言,接入RPA之后,相當(dāng)于接入了“四肢”,讓其不僅能夠“說給用戶聽”,還能幫用戶辦成事情,拿到結(jié)果。
RPA需要ChatGPT,降低使用門檻,提升產(chǎn)品能力
以上主要講了RPA對于ChatGPT的價值,接下來我們看看ChatGPT對于RPA的價值。總體來看,ChatGPT對于RPA的作用主要體現(xiàn)在兩個方面:降低使用門檻,提升產(chǎn)品能力。如下圖所示,在ChatGPT+RPA系統(tǒng)中,從用戶發(fā)布需求到獲得答案一共需要經(jīng)歷7步,ChatGPT中在前兩步主要體現(xiàn)的是降低使用門檻的價值,在最后兩步主要體現(xiàn)的是提升RPA產(chǎn)品能力的價值。
ChatGPT+RPA融合方案示意圖 數(shù)據(jù)猿制圖
1、ChatGPT降低RPA的使用門檻
一項新技術(shù)要發(fā)揮更大價值,實現(xiàn)普惠,有兩個關(guān)鍵前提,一是降低成本,二是把使用門檻降低到大多數(shù)普通人可以便捷操作的程度。
RPA的發(fā)展史,某種程度上就是使用門檻降低史。從“拖拉拽”即所得的專家模式 ;到所“點選用”即所得的小白模式,降低用戶使用門檻是重要的訴求。假設(shè)基于ChatGPT實現(xiàn)所“說”即所得模式,則RPA的使用門檻將進一步降低,這有助于RPA的進一步普及。
要實現(xiàn)人類用自然語言與RPA系統(tǒng)的順暢交互,核心是解決人類語言與機器語言不匹配的問題。目前,用戶要使用RPA系統(tǒng),得學(xué)習(xí)相關(guān)的操作規(guī)則,用系統(tǒng)能夠理解的方式來發(fā)布指令,這無形當(dāng)中在用戶和RPA系統(tǒng)之間豎起來一堵墻。
事實上,目前的大部分計算機系統(tǒng)只能接受規(guī)范化指令,根據(jù)指令來運行程序。如果人類說的話復(fù)雜一點,或者與其系統(tǒng)的指令集不符,系統(tǒng)就無法作出正確的反應(yīng),這也是目前大部分系統(tǒng)看起來很“傻”的重要原因。試想一下,如果你跟一個人交流,只能跟對方說特定的單詞或短語,對方回復(fù)你的也是只言片語,那整個交流過程必然會是低效的。并且,規(guī)范指令系統(tǒng)的學(xué)習(xí)成本高,并不是大多數(shù)普通人自然的交流方式。要實現(xiàn)智能系統(tǒng)的普惠化,就必須要降低人機的溝通成本。
如何來解決這一問題?核心思路是讓計算機系統(tǒng)來適應(yīng)人,而不是反過來。
20世紀(jì)60年代,人機交互的方式,還是人類通過命令行界面輸入一段指令,這種交互方式將計算機用戶限定在程序員群體。之后出現(xiàn)了視窗操作系統(tǒng)和鼠標(biāo),讓人機交互方式發(fā)生了巨大變革,才使得計算機飛入尋常百姓家??梢哉f,視窗操作系統(tǒng)架起了人類與計算機之間的一座橋梁。
某種程度上,ChatGPT可能成為人類與計算機系統(tǒng)之間的另一座橋梁:以ChatGPT來理解人類的自然語言,“解構(gòu)”成計算機系統(tǒng)可以理解的規(guī)范化指令;另一方面,計算機系統(tǒng)返回的結(jié)果,可以借助ChatGPT的內(nèi)容生成功能,形成方便人類理解的內(nèi)容。
也就是說,ChatGPT充當(dāng)了人類與計算機系統(tǒng)之間的“翻譯官”,將人類的自然語言,翻譯成計算機系統(tǒng)能夠理解的各種指令,同時將計算機系統(tǒng)的執(zhí)行結(jié)果,翻譯成方便人類理解的自然語言。
在這方面,國外有一個典型的應(yīng)用案例:一個開發(fā)人員,將ChatGPT與蘋果的Siri及其智能家居系統(tǒng)HomeKit相結(jié)合,讓用戶可以通過“聊天”的方式來控制智能家居,而不是像以往那樣只能機械的對智能家居系統(tǒng)說“開燈”、“關(guān)燈”、“打開空調(diào)”等命令。以實際效果來看,整個過程非常自然流暢,比以往的智能家居體驗要好很多。
ChatGPT+RPA,也可以借鑒上述思路。借助ChatGPT,讓人類可以用自然語言來向RPA系統(tǒng)發(fā)布指令,RPA系統(tǒng)根據(jù)需求來執(zhí)行對應(yīng)的業(yè)務(wù)流程,并把結(jié)果反饋給人類。
以下是用ChatGPT模擬的用RPA執(zhí)行需求的例子:
從上面結(jié)果可以發(fā)現(xiàn),ChatGPT可以理解用戶的需求,并將需求進行“解構(gòu)”,最終返回用戶想要的結(jié)果。用戶并不需要知道人力資源系統(tǒng)該怎么操作,也不需要知道RPA系統(tǒng)該怎么操作,只需要告訴ChatGPT要做什么,之后的一切就讓ChatGPT與RPA來配合完成。這種方式,無疑極大的降低了用戶的學(xué)習(xí)和使用門檻。用戶面對的不再是一個個冰冷、愚蠢的軟件系統(tǒng),而像是在面對一個真實的人力資源同事,用戶只需要告訴他需求,他就能完成接下來的業(yè)務(wù)流程操作。
當(dāng)然,以上只是一個模擬,當(dāng)真正接入RPA系統(tǒng)之后,ChatGPT返回給用戶的將不再是一段描述性文字,而是用戶上個月的工作時長分析報告。
ChatGPT提升RPA的產(chǎn)品能力
需要指出的是,ChatGPT的能力不僅僅在于理解人類的語言,還在于可以生成一個相對復(fù)雜、具有內(nèi)部邏輯結(jié)構(gòu)的結(jié)果反饋給用戶。因此,借助ChatGPT,不僅可以大幅度降低RPA的使用門檻,還能提升RPA產(chǎn)品本身的能力。
以數(shù)字員工為例,目前的數(shù)字員工大多只能實現(xiàn)比較簡單的業(yè)務(wù)流程,而對復(fù)雜業(yè)務(wù)往往力不從心。
如果將ChatGPT與RPA融合,則可以通過對業(yè)務(wù)流程進行“加工”,形成完善的解決方案,并以用戶易于理解和執(zhí)行的方式,返回結(jié)果。面對這樣一個數(shù)字員工,他不再是簡單機械的執(zhí)行用戶的單一指令,而是可以給出一個完善的解決方案,并且借助RPA系統(tǒng)來調(diào)用企業(yè)的各個業(yè)務(wù)系統(tǒng),來執(zhí)行這個方案,并給出方案執(zhí)行的結(jié)果。
以下是一個模擬的場景,模擬用ChatGPT+RPA系統(tǒng),來幫助銷售人員分析其銷售情況和用戶畫像,給出優(yōu)化建議,并形成年終總結(jié)報告。此外,還依據(jù)業(yè)績數(shù)據(jù)來核對薪酬情況。
上述例子只是一個模擬場景,可以想象一下,如果將企業(yè)的數(shù)字員工接入ChatGPT+RPA,那么這個數(shù)字員工該多么的強大??梢哉f,ChatGPT+RPA可以讓數(shù)字員工不再徒有其表,而是賦予其一個強大的“靈魂”。
ChatGPT+RPA,AIGC的下一個挑戰(zhàn)
以上,我們對ChatGPT+RPA的應(yīng)用場景進行了暢想。如果以上設(shè)想可以實現(xiàn),無論是對于ChatGPT還是RPA而言,都將是前進了一大步。
但需要指出的是,所有美好的設(shè)想都不是可以輕易實現(xiàn)的。ChatGPT+RPA要能夠?qū)崿F(xiàn)很好的融合,需要解決一系列的難題。其中,最為關(guān)鍵的要讓ChatGPT具備生成業(yè)務(wù)流程的能力。
目前,ChatGPT還只能返回文本結(jié)果,即使對于更廣泛的AIGC領(lǐng)域,返回的結(jié)果也局限于文本、圖片、視頻,這對于RPA的應(yīng)用是遠遠不夠的。如何生成具有邏輯結(jié)構(gòu)的業(yè)務(wù)流程,其難度很可能要高于生成文本、圖片甚至視頻。
要解決這個問題,一方面需要算法模型的創(chuàng)新,另一方面需要大量的業(yè)務(wù)流程數(shù)據(jù)來訓(xùn)練模型。要達到理想的結(jié)果,依然還有很多工作需要做。路漫漫其修遠兮,吾將上下而求索。只要方向是正確的,即使路途坎坷一點,付出的努力也終將有豐厚的回報。
據(jù)孫林君介紹,實在智能目前正在加緊ChatGPT+RPA的技術(shù)產(chǎn)品研發(fā),在不久就將有新產(chǎn)品面向市場。屆時,用戶將能夠切實體驗到這一融合方案所帶來的革命性成就。最終效果如何,讓我們拭目以待吧。
文:月滿西樓 / 數(shù)據(jù)猿
來源:數(shù)據(jù)猿