【金猿產(chǎn)品展】有數(shù)ChatBI——基于大模型的可信對(duì)話式數(shù)據(jù)分析平臺(tái)
【數(shù)據(jù)猿導(dǎo)讀】 本產(chǎn)品由網(wǎng)易數(shù)帆投遞并參與“數(shù)據(jù)猿年度金猿策劃活動(dòng)——2023中國大數(shù)據(jù)產(chǎn)業(yè)年度創(chuàng)新服務(wù)產(chǎn)品榜單/獎(jiǎng)項(xiàng)”評(píng)選。

有數(shù)ChatBI是網(wǎng)易數(shù)帆于2023年推出的基于網(wǎng)易自研大模型的對(duì)話式數(shù)據(jù)智能助手,旨在實(shí)現(xiàn)自然語言對(duì)話即分析,通過日常對(duì)話的方式即可獲得可信的數(shù)據(jù),極大降低數(shù)據(jù)消費(fèi)門檻,引領(lǐng)數(shù)據(jù)分析新范式。有數(shù)ChatBI是數(shù)據(jù)分析領(lǐng)域的一個(gè)全新的解決方案,也是目前國內(nèi)首個(gè)自研私有模型的自然語言對(duì)話式交互的產(chǎn)品。通過自然語言與BI平臺(tái)進(jìn)行交互,就像與另一個(gè)人交談一樣,哪怕是不懂?dāng)?shù)據(jù)的業(yè)務(wù)運(yùn)營也能快速取數(shù),實(shí)現(xiàn)自助的數(shù)據(jù)查詢和分析。
2023年重大更新升級(jí)
有數(shù)ChatBI引入大模型,在當(dāng)前大模型無法做到100%準(zhǔn)確的情況下,以追求可信的方式,克服AI幻覺和不穩(wěn)定的,做到生產(chǎn)可用。
1、檢索增強(qiáng)技術(shù),提升模型自適應(yīng)能力
不同場(chǎng)景數(shù)據(jù)表的字段命名和字段值定義各有不同,常見的基于LLM的NL2SQL方案會(huì)把建表語句(DDL)作為上下文寫入prompt中,以此向模型注入表信息。然而只有字段名稱和類型信息,大模型對(duì)于數(shù)據(jù)表的認(rèn)知依然不夠全面,很容易出現(xiàn)選錯(cuò)字段、字段值格式不匹配等問題。
網(wǎng)易數(shù)帆采用了檢索增強(qiáng)技術(shù),充分發(fā)揮BI系統(tǒng)查表迅捷便利的優(yōu)勢(shì),針對(duì)不同問題把更相關(guān)的表格元數(shù)據(jù)也拼接到prompt中,顯著提升模型對(duì)數(shù)據(jù)表的理解能力。該策略使大模型對(duì)數(shù)據(jù)表的“視野”更加廣泛,具備了自適應(yīng)能力。
2、個(gè)性化知識(shí)配置,適配定制化問題和問法
不同業(yè)務(wù)方會(huì)有自己的行業(yè)“黑話”或知識(shí),例如云音樂的運(yùn)營同學(xué)經(jīng)常會(huì)查看“最近分區(qū)”的數(shù)據(jù),但大模型不理解“最近分區(qū)”,就可以把最近分區(qū)配置為提示詞:最近分區(qū)=昨天,這樣大模型能夠理解用戶提問中的“最近分區(qū)”
為了提升大模型在這類定制化問題上的適應(yīng)性,網(wǎng)易數(shù)帆提供了個(gè)性化知識(shí)配置的功能和相應(yīng)適配的算法,不同客戶可以按需自行配置內(nèi)部沉淀的知識(shí)和問法,無需重新訓(xùn)練,即配即生效,客戶可以打造個(gè)性化的ChatBI產(chǎn)品。
3、模型自學(xué)習(xí),越用越聰明
ChatGPT等LLM的一大特性在于通過對(duì)話形式指出錯(cuò)誤、循循善誘,模型能夠發(fā)現(xiàn)自己的問題并修正。受此啟發(fā),網(wǎng)易數(shù)帆設(shè)計(jì)了模型自學(xué)習(xí)的流程,對(duì)于當(dāng)前回答不好的問題,ChatBI管理員進(jìn)行記錄并糾正。下一次再問到類似問題時(shí),模型能夠參考糾正過的內(nèi)容重新生成正確SQL,達(dá)到越用越聰明的效果。
應(yīng)用場(chǎng)景/人群
有數(shù)ChatBI已經(jīng)成為推廣數(shù)據(jù)文化“人人用數(shù)據(jù),時(shí)時(shí)用數(shù)據(jù)”的利器。人人代表的是數(shù)據(jù)的使用范圍,不再局限于少數(shù)的管理者,而是企業(yè)中每一個(gè)參與運(yùn)營的一線員工;時(shí)時(shí)代表的是數(shù)據(jù)的使用頻率,數(shù)據(jù)不再是月末考核時(shí)才去關(guān)注,而是作為工作中必須要時(shí)時(shí)依賴的工具。
例如:
1)HR團(tuán)隊(duì):過往他們只有IT系統(tǒng),當(dāng)需要做員工福利及活動(dòng)關(guān)懷時(shí)要么求助IT人員拉數(shù)據(jù),要么找自己的百寶箱個(gè)人維護(hù)的大Excel,要么時(shí)效性很難滿足需求、要么數(shù)據(jù)滯后。利用有數(shù)ChatBI作為數(shù)據(jù)助手,HR團(tuán)隊(duì)能很好地自助完成碎片化和臨時(shí)緊急的訴求,例如活動(dòng)關(guān)懷,人才盤點(diǎn)等。
2)業(yè)務(wù)負(fù)責(zé)人:可以跟蹤商機(jī),合同,收入,回款,能更快速了解業(yè)務(wù)狀況,輔助業(yè)務(wù)制定銷售策略,并及時(shí)調(diào)整;同時(shí)在討論業(yè)務(wù)方向或者產(chǎn)品規(guī)劃時(shí)他又能多維度、不同視角組合下的數(shù)據(jù)趨勢(shì)分析,便于我們及時(shí)決策,而非固定式的報(bào)表。
3)財(cái)務(wù)團(tuán)隊(duì):財(cái)務(wù)、內(nèi)審對(duì)待所有非自己產(chǎn)出的數(shù)據(jù)都是持懷疑態(tài)度的,尤其是季報(bào)財(cái)報(bào)投資者關(guān)注的分析數(shù)據(jù),更是多輪審核。這種復(fù)核校驗(yàn),交叉驗(yàn)證,層層審核,非常的耗時(shí),所以他們利用ChatBI幫他們做一輪審核,能極大提升效率。
產(chǎn)品功能
借助網(wǎng)易自研大模型,有數(shù)ChatBI能以門檻低、效率高、智能化的特色,滿足普通用戶的分析訴求。做到“對(duì)話即有數(shù)”,降低數(shù)據(jù)使用門檻,實(shí)現(xiàn)人人用數(shù)據(jù)。
1)門檻更低:利用大模型的自然語言理解能力,用戶只需要與 AI 助手進(jìn)行對(duì)話,即可獲得數(shù)據(jù),提升用戶的便利性。
2)效率更優(yōu):借助大模型的能理解用戶需求,從對(duì)話轉(zhuǎn)換為數(shù)據(jù)庫查表和可視化圖表,用戶提升分析效率。
3)智能化:從人工設(shè)計(jì)的規(guī)則和模型轉(zhuǎn)化為自動(dòng)學(xué)習(xí)的規(guī)則,能夠處理更復(fù)雜和更深度的數(shù)據(jù)分析任務(wù)。
產(chǎn)品全景圖如下:
產(chǎn)品優(yōu)勢(shì)
從企業(yè)落地的角度,由于AI大模型存在嚴(yán)重的“幻覺”問題,AI給出的回答并不一定是百分百準(zhǔn)確,并且這一問題無法避免。但數(shù)據(jù)分析是一個(gè)非常嚴(yán)謹(jǐn)、對(duì)準(zhǔn)確性要求極高的場(chǎng)景,因此為了解決模型的幻覺問題,網(wǎng)易數(shù)帆在產(chǎn)品模式上做了四大創(chuàng)新,實(shí)現(xiàn)有數(shù)ChatBI“可信”的保障:
1、需求可理解
有數(shù)ChatBI利用大模型能力,能準(zhǔn)確理解用戶自然語言提問,同時(shí)理解業(yè)務(wù)數(shù)據(jù),確保每一次提問都能得到精準(zhǔn)的回答。
2、過程可驗(yàn)證
把查詢過程盡可能透明,明確告訴用戶當(dāng)前的查詢結(jié)果是基于哪個(gè)數(shù)據(jù)表,并且把復(fù)雜的SQL查詢過程轉(zhuǎn)化成100%正確的結(jié)構(gòu)化表達(dá),用大白話告訴用戶,這個(gè)數(shù)據(jù)是用什么邏輯獲取到的,哪怕是不懂SQL的小白用戶也能一眼看清楚這個(gè)邏輯是不是正確,也能驗(yàn)證結(jié)果的準(zhǔn)確信。
3、用戶可干預(yù)
假設(shè)AI當(dāng)前給出的回答是錯(cuò)誤的,用戶也可以進(jìn)行自主干預(yù),切換成正確的數(shù)據(jù)表,把已經(jīng)結(jié)構(gòu)化的查詢條件修正成正確的。
4、產(chǎn)品可運(yùn)營
用戶可以給大模型一個(gè)最直觀的反饋,標(biāo)記及優(yōu)化查詢結(jié)果的badcase,迭代改進(jìn)模型,讓大模型越用越聰明。并且可在后臺(tái)預(yù)置各業(yè)務(wù)的常用問題,搭建業(yè)務(wù)方的自有知識(shí)庫。
服務(wù)客戶/使用人數(shù)
產(chǎn)品總使用客戶量或人群數(shù)量:
1)在網(wǎng)易內(nèi)部,有數(shù)ChatBI在網(wǎng)易云音樂等業(yè)務(wù)落地,已經(jīng)覆蓋了產(chǎn)品、運(yùn)營、市場(chǎng)、財(cái)務(wù)等非技術(shù)人員。
2)借助網(wǎng)易內(nèi)部的成功落地,有數(shù)ChatBI產(chǎn)品發(fā)布后,吸引了甄云科技等幾十家外部客戶試用。
市場(chǎng)價(jià)值
1、業(yè)務(wù)價(jià)值
以網(wǎng)易云音樂為例,在ChatBI產(chǎn)品上線之前,業(yè)務(wù)用戶臨時(shí)性的用數(shù)看數(shù)需求,一般都需要有數(shù)據(jù)分析師/數(shù)倉研發(fā)專人承接,排期解決。不僅耗費(fèi)了大量人力,需求響應(yīng)也不及時(shí),取數(shù)需求滯后性一定程度上也影響了業(yè)務(wù)策略。
而ChatBI產(chǎn)品上線后,有取數(shù)需求的用戶只需要通過對(duì)話即可獲得想看的數(shù)據(jù),零使用門檻,秒級(jí)需求響應(yīng)。至少創(chuàng)造了三大業(yè)務(wù)價(jià)值:
(1)通過自然語言取數(shù)大幅提升數(shù)據(jù)查詢類的需求人效,目前累計(jì)取數(shù)12000+次,假設(shè)每次問答節(jié)約0.2人天,為業(yè)務(wù)節(jié)省了2000+人日;
(2)借助智能數(shù)據(jù)查詢方案,云音樂的產(chǎn)品、運(yùn)營、市場(chǎng)等非技術(shù)同學(xué)都可以嘗試進(jìn)行數(shù)據(jù)探索分析,賦能更多業(yè)務(wù)人員,人人都配有一個(gè)專屬的智能數(shù)據(jù)分析師;
(3)把數(shù)據(jù)開發(fā)人力從高頻的臨時(shí)取數(shù)需求中釋放出來,助力開發(fā)同學(xué)專注更加核心的業(yè)務(wù),云音樂數(shù)倉團(tuán)隊(duì)才得以沉淀大量的數(shù)據(jù)資產(chǎn)。
2、社會(huì)經(jīng)濟(jì)效益
借助網(wǎng)易內(nèi)部的成功落地,產(chǎn)品發(fā)布后,吸引了幾十家外部客戶試用。各行業(yè)客戶利用ChatBI產(chǎn)品,盤活了企業(yè)已有的大量數(shù)據(jù)資產(chǎn),從企業(yè)CEO到一線銷售集團(tuán)內(nèi)自上而下的人員都能自由得獲取數(shù)據(jù)、分析探索,打開了企業(yè)數(shù)字化建設(shè)的新思路、有了更加智能的數(shù)字化落地新方案。
3、技術(shù)影響力
作為國內(nèi)首個(gè)自研私有模型的自然語言對(duì)話式交互的產(chǎn)品,項(xiàng)目組成員參與信通院《大模型驅(qū)動(dòng)的智能數(shù)據(jù)分析工具》技術(shù)標(biāo)準(zhǔn)制定,并申請(qǐng)了3個(gè)專利,另有5個(gè)專利正在申請(qǐng)中。網(wǎng)易數(shù)帆在2023年8月召開產(chǎn)品發(fā)布會(huì),正式發(fā)布上線ChatBI產(chǎn)品。在產(chǎn)品發(fā)布后,項(xiàng)目組成員在中國計(jì)算機(jī)學(xué)會(huì)技術(shù)前線(CCF TF)第112期、網(wǎng)易和CSDN聯(lián)合舉辦的大數(shù)據(jù)技術(shù)沙龍、以及走進(jìn)網(wǎng)易主題的大數(shù)據(jù)技術(shù)研討會(huì)上海站等外部活動(dòng)中均分享了ChatBI的實(shí)踐。
產(chǎn)品所屬企業(yè)·:網(wǎng)易數(shù)帆
網(wǎng)易數(shù)帆是網(wǎng)易旗下 ToB 企業(yè)服務(wù)品牌,定位于數(shù)智軟件生產(chǎn)引領(lǐng)者,依托網(wǎng)易二十余年互聯(lián)網(wǎng)技術(shù)積累,推出自研無綁定的云原生、大數(shù)據(jù)、人工智能、智能開發(fā)等產(chǎn)品,并通過打造開放的數(shù)智產(chǎn)業(yè)鏈生態(tài)體系,為客戶提供數(shù)智化全流程服務(wù)。
目前已服務(wù)金融、制造、國央企等行業(yè)400多家頭部企業(yè),為客戶提供量身定制的數(shù)字化轉(zhuǎn)型解決方案,幫助客戶在全面數(shù)智化時(shí)代打造專屬數(shù)智競(jìng)爭(zhēng)力。
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評(píng)論
不容錯(cuò)過的資訊
-
1數(shù)據(jù)資產(chǎn)入表攻略:數(shù)錢數(shù)到手軟的秘訣!
-
2百度回應(yīng)與四維圖新著作權(quán)案敗訴;螞蟻開
-
3【金猿人物展】數(shù)瀾科技聯(lián)合創(chuàng)始人白松:
-
4Xiaopeng Hutian split flying car
-
5H3c and Zhejiang Mobile will coop
-
6思必馳完成新一輪首期兩億元融資
-
7【金猿投融展】HashData——致力于降低企
-
8“華政數(shù)據(jù)法律研究中心數(shù)據(jù)流通交易實(shí)務(wù)
-
9Wu Yongqiao will become president
-
10【金猿技術(shù)展】一種位置隱私保護(hù)的虛擬軌
大數(shù)據(jù)企業(yè)推薦more >
大家都在搜
