【數(shù)智化案例展】立臻科技——大模型助力制造企業(yè)數(shù)據(jù)智能化
原創(chuàng) 楓清科技 | 2024-07-02 20:41
【數(shù)據(jù)猿導(dǎo)讀】 立臻科技作為頭部智能手機(jī)主要代工廠,在蘇州擁有兩座智能化工廠,年產(chǎn)值過千億元,年聘用員工達(dá)數(shù)十萬余人,設(shè)備和人構(gòu)成了公司最重要的核心資產(chǎn)。立臻科技目前擁有IT研發(fā)人員超過200余名,已經(jīng)構(gòu)建了相對(duì)完善的數(shù)據(jù)治理體系以及完整的數(shù)據(jù)平臺(tái),在智能化方面,也率先落地了包括視覺質(zhì)...

楓清科技案例
本項(xiàng)目案例由楓清科技投遞并參與數(shù)據(jù)猿與上海大數(shù)據(jù)聯(lián)盟聯(lián)合推出的《2024中國(guó)數(shù)智化轉(zhuǎn)型升級(jí)創(chuàng)新服務(wù)企業(yè)》榜單/獎(jiǎng)項(xiàng)”評(píng)選。
立臻科技作為頭部智能手機(jī)主要代工廠,在蘇州擁有兩座智能化工廠,年產(chǎn)值過千億元,年聘用員工達(dá)數(shù)十萬余人,設(shè)備和人構(gòu)成了公司最重要的核心資產(chǎn)。立臻科技目前擁有IT研發(fā)人員超過200余名,已經(jīng)構(gòu)建了相對(duì)完善的數(shù)據(jù)治理體系以及完整的數(shù)據(jù)平臺(tái),在智能化方面,也率先落地了包括視覺質(zhì)檢、預(yù)測(cè)性維護(hù)、智能生產(chǎn)排程等智能化場(chǎng)景。
隨著大模型的發(fā)展,立臻科技意識(shí)到可充分借助大模型的能力,全面提升公司的數(shù)據(jù)智能化建設(shè),并接觸多家業(yè)界一流的AI公司和一流的科研團(tuán)隊(duì),楓清科技(Fabarta)通過與立臻科技的多次交流,其在大模型領(lǐng)域的產(chǎn)品建設(shè)、全部大廠的團(tuán)隊(duì)背景以及落地理念,深得立臻科技認(rèn)可,并于2023年末正式達(dá)成合作關(guān)系,目前相關(guān)合作正在按計(jì)劃推進(jìn)中。
在制造行業(yè),典型的勞動(dòng)密集型特征導(dǎo)致了高流動(dòng)率。這一行業(yè)面臨的挑戰(zhàn)不僅限于人力資源管理,還包括生產(chǎn)技術(shù)文檔的復(fù)雜多樣性和設(shè)備數(shù)據(jù)的海量生成,但這些數(shù)據(jù)往往難以直接轉(zhuǎn)化為有效的決策支持。
立臻科技面臨的問題和挑戰(zhàn)促使他們希望通過智能系統(tǒng)來改進(jìn)解決。首先,集團(tuán)每年管理數(shù)十萬名作業(yè)員,管理層充分認(rèn)識(shí)到對(duì)一線作業(yè)員進(jìn)行有效的管理和關(guān)懷對(duì)提升生產(chǎn)效率、控制成本至關(guān)重要。集團(tuán)高層將員工管理比喻為一座潛力巨大的礦山,需要深入挖掘。其次,制造行業(yè)的設(shè)備知識(shí)庫現(xiàn)狀復(fù)雜,知識(shí)難以共享和利用,導(dǎo)致信息孤島現(xiàn)象的形成。因此,建立統(tǒng)一的知識(shí)管理系統(tǒng)成為必然選擇,以提升整體生產(chǎn)水平和技術(shù)創(chuàng)新能力。第三,制造核心環(huán)節(jié)急需智能化制造決策支持系統(tǒng)。通過充分利用設(shè)備數(shù)據(jù)、生產(chǎn)技術(shù)文檔和行業(yè)知識(shí),實(shí)現(xiàn)從數(shù)據(jù)到?jīng)Q策的有效轉(zhuǎn)化,將大幅提高生產(chǎn)效率和產(chǎn)品質(zhì)量水平。通過這三方面的深入改進(jìn),楓清科技(Fabarta)聯(lián)手立臻科技致力于通過大模型來提升管理效率和生產(chǎn)效益,助力制造行業(yè)實(shí)現(xiàn)智能化轉(zhuǎn)型,邁向更加高效和可持續(xù)的發(fā)展。
時(shí)間周期:
開始時(shí)間:2023.9
截止時(shí)間:
節(jié)點(diǎn)1:初步構(gòu)建大模型知識(shí)中臺(tái),覆蓋人力資源文檔數(shù)據(jù)管理 2024.2
節(jié)點(diǎn)2:初步覆蓋生產(chǎn)制造知識(shí)管理,構(gòu)建廠內(nèi)制造業(yè)大模型,并初步對(duì)接數(shù)據(jù)平臺(tái)數(shù)據(jù) 2024.6
節(jié)點(diǎn)3:全面覆蓋生產(chǎn)制造數(shù)據(jù),擴(kuò)大結(jié)構(gòu)化數(shù)據(jù)對(duì)接,基于智能體和大小模型等,選擇部分場(chǎng)景實(shí)現(xiàn)制造領(lǐng)域智能決策(進(jìn)行中,2024.9)
節(jié)點(diǎn)4:全面對(duì)接數(shù)據(jù)平臺(tái),并構(gòu)建相對(duì)完善的大模型知識(shí)中臺(tái),覆蓋結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),對(duì)接已有大小模型,可基于該平臺(tái)體系化落地更多業(yè)務(wù)場(chǎng)景(2024.12)
數(shù)智化需求
立臻科技具備業(yè)界領(lǐng)先的工廠智能化建設(shè)和領(lǐng)先的科技人才隊(duì)伍,目前公司已經(jīng)具備完善的數(shù)據(jù)平臺(tái)并已落地大量智能化場(chǎng)景,在制造業(yè)中企業(yè)中,具備領(lǐng)先的數(shù)智化發(fā)展水平。
公司目標(biāo)是能夠借助大模型的發(fā)展,能夠全面利用已沉淀的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),改變過去點(diǎn)狀落地智能化場(chǎng)景的方式,希望能夠體系化全面落地智能化能力,全面提升智慧工廠建設(shè),不斷提升公司的智能化競(jìng)爭(zhēng)力。為此,立臻科技制定了分布三步走的策略:第一階段,圍繞人力、財(cái)務(wù)等支撐性領(lǐng)域,率先進(jìn)行大模型落地實(shí)踐,構(gòu)建初步的應(yīng)用場(chǎng)景,并搭建大模型落地支撐平臺(tái);第二階段,打通已有數(shù)據(jù)平臺(tái),全面覆蓋生產(chǎn)制造數(shù)據(jù),并借助大模型提升數(shù)據(jù)使用體驗(yàn),并提升部分生產(chǎn)制造業(yè)務(wù)場(chǎng)景智能化;第三階段,基于融合后的大模型平臺(tái)和數(shù)據(jù)平臺(tái),并結(jié)合已有大小模型和智能體建設(shè),平臺(tái)化全面落地智能化場(chǎng)景,提升工廠智能化建設(shè)。
當(dāng)前,楓清科技(Fabarta)同立臻科技一道,已順利完成第一階段建設(shè),已實(shí)現(xiàn)對(duì)人力資源多個(gè)智能化業(yè)務(wù)場(chǎng)景建設(shè),并邁向第二階段,打通數(shù)據(jù)平臺(tái),并覆蓋生產(chǎn)制造相關(guān)數(shù)據(jù)。每個(gè)階段對(duì)數(shù)智化的需求總結(jié)如下:
階段一:初步構(gòu)建大模型知識(shí)中臺(tái),覆蓋人力資源文檔數(shù)據(jù)管理
制造行業(yè)以勞動(dòng)密集型為主要特征,員工流動(dòng)率高。集團(tuán)每年管理數(shù)十萬名作業(yè)員,一線員工的管理和關(guān)懷直接影響生產(chǎn)效率、成本控制和整體效益,亟待通過大模型技術(shù)進(jìn)行深入挖掘和優(yōu)化。從支撐性業(yè)務(wù)開始,通過大模型對(duì)一些基礎(chǔ)系統(tǒng)的智能化升級(jí),比如規(guī)章、制度、薪資、休假、獎(jiǎng)懲等信息的問答,取代原有的靠人力去做一對(duì)一的服務(wù),極大程度的釋放了支持性崗位的基礎(chǔ)性、重復(fù)性工作,實(shí)現(xiàn)在支持性職能崗位人數(shù)不變的情況下可以更好的支持集團(tuán)的擴(kuò)廠擴(kuò)線。
階段二:初步覆蓋生產(chǎn)制造知識(shí)管理,構(gòu)建廠內(nèi)制造業(yè)大模型,并初步對(duì)接數(shù)據(jù)平臺(tái)數(shù)據(jù)
在第二階段,立臻科技的目標(biāo)是實(shí)現(xiàn)生產(chǎn)數(shù)據(jù)的全面整合和智能分析,從而提高生產(chǎn)效率,降低運(yùn)營(yíng)成本。通過使用大模型的能力,讓數(shù)據(jù)的出口不再局限于BI系統(tǒng),而是可以靠靈活的自然語言交互的形式實(shí)現(xiàn),全面降低用數(shù)、取數(shù)的門檻,提供數(shù)據(jù)智能在更廣泛的業(yè)務(wù)用戶、生產(chǎn)用戶的覆蓋度。
階段三:全面覆蓋生產(chǎn)制造數(shù)據(jù),擴(kuò)大結(jié)構(gòu)化數(shù)據(jù)對(duì)接,基于智能體和大小模型等,選擇部分場(chǎng)景實(shí)現(xiàn)制造領(lǐng)域智能決策
制造企業(yè)多模態(tài)數(shù)據(jù)沉淀龐大:結(jié)構(gòu)化數(shù)據(jù)以BI系統(tǒng)為代表,已經(jīng)實(shí)現(xiàn)一定程度上的數(shù)據(jù)智能;而對(duì)于非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)的分析與決策還在非常早期階段,大量數(shù)據(jù)依然沉淀在冰山之下無法產(chǎn)生業(yè)務(wù)價(jià)值;多模態(tài)融合的決策智能可以進(jìn)一步放大數(shù)據(jù)融通后的價(jià)值,提供更多的決策支持。
對(duì)于結(jié)構(gòu)化數(shù)據(jù),制造企業(yè)在設(shè)備產(chǎn)生的環(huán)境所產(chǎn)生的數(shù)據(jù)量非常龐大,但難以直接從數(shù)據(jù)中得出有效的決策。不僅僅需要一套數(shù)據(jù)平臺(tái)來解決數(shù)據(jù)的可見、可控,同時(shí)針對(duì)不同數(shù)據(jù)的業(yè)務(wù)含義、業(yè)務(wù)訴求進(jìn)行智能的分析和決策。通過知識(shí)驅(qū)動(dòng)的決策系統(tǒng),立臻科技將打造智能制造決策大腦。綜合利用設(shè)備數(shù)據(jù)、生產(chǎn)技術(shù)文檔和領(lǐng)域知識(shí),實(shí)現(xiàn)從數(shù)據(jù)到?jīng)Q策的智能轉(zhuǎn)化,提升生產(chǎn)效率和產(chǎn)品質(zhì)量。通過這一系統(tǒng),企業(yè)將能夠在復(fù)雜的生產(chǎn)環(huán)境中做出更加準(zhǔn)確和高效的決策,全面提升智慧工廠的建設(shè)水平。
面臨挑戰(zhàn)
面對(duì)當(dāng)前企業(yè)面臨的多重挑戰(zhàn),首先需要深入分析和解決的是員工管理方面的困難。
隨著企業(yè)規(guī)模和廠區(qū)擴(kuò)大,員工管理難度顯著增加。即便是細(xì)微的管理失誤,也可能導(dǎo)致員工離職,從而直接影響到生產(chǎn)排產(chǎn)計(jì)劃的執(zhí)行效率和穩(wěn)定性。這種影響不僅僅限于人力資源的重新招聘和培訓(xùn)成本,更涉及到生產(chǎn)線的穩(wěn)定性和運(yùn)行效率。因此,有效的員工管理和保持員工穩(wěn)定是當(dāng)前企業(yè)急需解決的首要問題之一。
其次,隨著企業(yè)規(guī)模的擴(kuò)大,管理成本也呈現(xiàn)出線性增長(zhǎng)的趨勢(shì)。這不僅包括人力資源管理的成本,還涉及到管理工具和系統(tǒng)的投入成本。傳統(tǒng)的管理方式往往無法有效應(yīng)對(duì)規(guī)模擴(kuò)大帶來的管理挑戰(zhàn),需要引入更為智能化和系統(tǒng)化的管理解決方案,以降低管理成本,提升管理效率和準(zhǔn)確性。
此外,企業(yè)在員工個(gè)性化需求滿足方面面臨的問題也不容忽視?,F(xiàn)有系統(tǒng)往往缺乏足夠的靈活性和個(gè)性化定制功能,難以有效地滿足員工多樣化的需求。特別是一線作業(yè)工人文化水平不高,對(duì)于普通IT系統(tǒng)的操作和利用能力有所限制,需要更加簡(jiǎn)化和智能化的系統(tǒng)設(shè)計(jì),使其能夠輕松適應(yīng)員工的操作習(xí)慣和能力水平。
面對(duì)制造業(yè)的多模態(tài)數(shù)據(jù)分析挑戰(zhàn),企業(yè)面臨著復(fù)雜的數(shù)據(jù)處理問題。
制造業(yè)中產(chǎn)生的數(shù)據(jù)通常是多模態(tài)的,包括非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)的分析與決策支持仍處于早期階段。傳統(tǒng)的數(shù)據(jù)分析方法可能無法有效地整合和分析這些多樣化的數(shù)據(jù)類型,導(dǎo)致信息孤立和決策效率低下。特別是在生產(chǎn)過程中,涉及到從設(shè)備傳感器收集的實(shí)時(shí)數(shù)據(jù)到質(zhì)量控制記錄,再到供應(yīng)鏈管理中的物流數(shù)據(jù),這些數(shù)據(jù)來源廣泛且類型不一,如何實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一管理和分析成為制造業(yè)面臨的重要挑戰(zhàn)之一。缺乏有效的數(shù)據(jù)分析和決策支持系統(tǒng),企業(yè)難以從這些數(shù)據(jù)中準(zhǔn)確提取有價(jià)值的信息,并據(jù)此進(jìn)行即時(shí)的生產(chǎn)優(yōu)化和戰(zhàn)略調(diào)整。
通過大模型幫助企業(yè)獲得高質(zhì)量數(shù)據(jù)后,進(jìn)一步就是如何利用大模型對(duì)通用知識(shí)的理解能力,配合專有制造業(yè)模型對(duì)特定場(chǎng)景垂直的推理能力,讓大模型結(jié)合業(yè)務(wù)場(chǎng)景、系統(tǒng)需要自主的選擇合適的小模型,充分發(fā)揮各自的優(yōu)勢(shì),提升系統(tǒng)整體決策的能力。
數(shù)據(jù)支持
在立臻科技聯(lián)手楓清科技(Fabarta)的大模型落地中,數(shù)據(jù)處理涉及多個(gè)關(guān)鍵方面,每個(gè)方面都對(duì)最終分析和應(yīng)用結(jié)果至關(guān)重要。
對(duì)于非結(jié)構(gòu)化數(shù)據(jù)的解析,這類數(shù)據(jù)通常包含多種格式和來源,例如各種生產(chǎn)制造的知識(shí)庫中的文檔、文件等,其中也具有復(fù)雜的內(nèi)部結(jié)構(gòu)和關(guān)聯(lián)關(guān)系。通過數(shù)據(jù)解析技術(shù),可以有效保障上下文的完整性,確保從數(shù)據(jù)中提取的信息不失真或遺漏重要細(xì)節(jié),相較于傳統(tǒng)的簡(jiǎn)單切片方法,效果顯著提升。以圖片數(shù)據(jù)的理解與識(shí)別為代表,大量的多模態(tài)數(shù)據(jù)需要準(zhǔn)確的解析和識(shí)別。利用計(jì)算機(jī)視覺技術(shù),可以從圖片中提取關(guān)鍵特征,并進(jìn)行模式識(shí)別和分類,對(duì)于質(zhì)量控制、產(chǎn)品監(jiān)測(cè)和工藝優(yōu)化具有重要意義。
對(duì)于關(guān)系型數(shù)據(jù)的元數(shù)據(jù)補(bǔ)齊,這對(duì)于大型數(shù)據(jù)模型的正確理解至關(guān)重要。通過為數(shù)據(jù)庫中的表和字段添加業(yè)務(wù)含義的元數(shù)據(jù),可以提升大模型對(duì)業(yè)務(wù)邏輯的理解和預(yù)測(cè)能力,進(jìn)而優(yōu)化數(shù)據(jù)分析和決策過程。元數(shù)據(jù)的豐富性和準(zhǔn)確性直接影響到數(shù)據(jù)分析的質(zhì)量和結(jié)果的可信度。
對(duì)于多模態(tài)數(shù)據(jù)的融合分析,元數(shù)據(jù)規(guī)范和統(tǒng)一是大模型落地的基礎(chǔ),元數(shù)據(jù)讓大模型知道應(yīng)該用到哪些數(shù)據(jù)提供對(duì)應(yīng)服務(wù)。通過元數(shù)據(jù)過濾,提升大模型問答篩選范圍,提升問答精準(zhǔn)度;通過元數(shù)據(jù),為智能BI場(chǎng)景提供數(shù)據(jù)基礎(chǔ)。元數(shù)據(jù)為大模型提供了很好的語義層支持,在準(zhǔn)備好高質(zhì)量數(shù)據(jù)和語義層之后,需要能夠有好的體系能鏈接大模型和數(shù)據(jù)。楓清科技(Fabarta)通過多模態(tài)數(shù)據(jù)引擎來統(tǒng)一存儲(chǔ)數(shù)據(jù)和元數(shù)據(jù),并構(gòu)建面向大模型的統(tǒng)一記憶體,同時(shí)還借助系統(tǒng)內(nèi)置的問數(shù)、問指標(biāo)類工具,快速方便用戶去獲取和分析數(shù)據(jù),并積極嘗試借助智能體來串聯(lián)大小模型,使得用戶不僅僅是能便捷取數(shù)、用數(shù),還能夠借助模型的能力結(jié)合業(yè)務(wù)做進(jìn)一步的數(shù)據(jù)分析,幫助客戶來做決策。此外,楓清科技(Fabarta)還提供了低代碼化能力,能夠便捷的將數(shù)據(jù)價(jià)值嵌入到已有業(yè)務(wù)系統(tǒng)或者快速構(gòu)建AI場(chǎng)景應(yīng)用,加速推動(dòng)基于數(shù)據(jù)驅(qū)動(dòng)的AI能力落地。
綜上所述,數(shù)據(jù)處理的復(fù)雜性和技術(shù)挑戰(zhàn)需要綜合運(yùn)用先進(jìn)的數(shù)據(jù)解析、識(shí)別技術(shù)以及元數(shù)據(jù)管理策略,以確保從數(shù)據(jù)中獲取的信息準(zhǔn)確、全面,并能夠有效支持業(yè)務(wù)決策和創(chuàng)新。
應(yīng)用技術(shù)與實(shí)施過程
楓清科技(Fabarta)企業(yè)知識(shí)中臺(tái),旨在鏈接大模型和企業(yè)數(shù)據(jù),幫助企業(yè)全面化落地智能場(chǎng)景。在當(dāng)前與立臻科技的落地實(shí)踐中,率先從人力資源場(chǎng)景切入,既面向普通員工提供終端自助服務(wù),同時(shí)還面向人力資源專員提供智能化的知識(shí)檢索和智能問數(shù)等體驗(yàn)。這項(xiàng)服務(wù)能夠與各種業(yè)務(wù)場(chǎng)景進(jìn)行對(duì)接,包括不同廠區(qū)的巡檢機(jī)器人機(jī)器人,以及輿情對(duì)話場(chǎng)景。企業(yè)知識(shí)中臺(tái)在立臻本地環(huán)境中部署,集成了Text2api、Text2sql、多格式文檔解析等關(guān)鍵技術(shù)組件。此外,還包含了基于大模型的問答服務(wù)、文檔權(quán)限管理、知識(shí)運(yùn)營(yíng)和知識(shí)管理等高級(jí)功能。在技術(shù)落地的過程中,其核心技術(shù)點(diǎn)總結(jié)如下:
知識(shí)解析與術(shù)語理解
在制造業(yè)的實(shí)施中,知識(shí)解析和黑話理解是關(guān)鍵的技術(shù)支持。通過將文檔結(jié)構(gòu)解析為圖譜結(jié)構(gòu),大模型能夠更好地理解文檔中的關(guān)聯(lián)性知識(shí)上下文。這種技術(shù)不僅提升了回答準(zhǔn)確率,還能夠快速提取和理解復(fù)雜的制造業(yè)術(shù)語和企業(yè)內(nèi)部用語。例如,通過同義詞機(jī)制維護(hù)行業(yè)術(shù)語,大模型能夠在處理實(shí)際作業(yè)時(shí)更精準(zhǔn)地理解和應(yīng)用專業(yè)術(shù)語,從而提高生產(chǎn)效率和準(zhǔn)確性。文檔知識(shí)管理和問答知識(shí)管理是智能對(duì)話服務(wù)的重要組成部分,它們?cè)试S用戶通過對(duì)話形式訪問和管理知識(shí)庫,從而提高信息檢索的效率和準(zhǔn)確性。這種管理方式不僅優(yōu)化了用戶與系統(tǒng)之間的交互,也為知識(shí)共享和再利用提供了便利。
在大數(shù)據(jù)量情況下,傳統(tǒng)的RAG(Retriever-augmented Generation)召回系統(tǒng)往往面臨召回范圍過廣、回答干擾信息過多的問題,直接導(dǎo)致回答不準(zhǔn)確。這在制造業(yè)中尤為明顯,因?yàn)橹圃鞓I(yè)的數(shù)據(jù)種類繁多,既包括結(jié)構(gòu)化數(shù)據(jù)(如生產(chǎn)設(shè)備的實(shí)時(shí)運(yùn)行數(shù)據(jù)),也包括非結(jié)構(gòu)化數(shù)據(jù)(如設(shè)備的維護(hù)手冊(cè)和操作指南)。為了應(yīng)對(duì)這些挑戰(zhàn),本項(xiàng)目采用了統(tǒng)一語義層增強(qiáng)的多模態(tài)知識(shí)融合技術(shù)。將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行融合,構(gòu)建了一個(gè)統(tǒng)一的語義層。這個(gè)語義層能夠理解并關(guān)聯(lián)不同類型的數(shù)據(jù),從而在回答問題時(shí)提供更加精準(zhǔn)和全面的信息。通過構(gòu)建語義關(guān)聯(lián)拓?fù)?,可以在設(shè)備類型、生產(chǎn)商和文檔信息之間建立緊密的聯(lián)系,確保每個(gè)回答都基于最相關(guān)和最新的知識(shí)。通過這種多模態(tài)知識(shí)融合技術(shù)的應(yīng)用,本項(xiàng)目顯著提升了回答的精準(zhǔn)度,解決了傳統(tǒng)RAG系統(tǒng)中回答不準(zhǔn)的問題,并且實(shí)現(xiàn)了對(duì)知識(shí)本身的擴(kuò)展和深化。
智能問數(shù)技術(shù)
通過理解自然語言查詢并將其轉(zhuǎn)換為SQL查詢語句,極大地提高了從數(shù)據(jù)庫中提取信息的效率。使用統(tǒng)一語義層的方式,將多模態(tài)異構(gòu)數(shù)據(jù)源的元數(shù)據(jù)進(jìn)行集中管理,幫助大模型更好的理解不同業(yè)務(wù)含義所對(duì)應(yīng)的元數(shù)據(jù)信息,同時(shí)通過動(dòng)態(tài)提示詞的方式,將特有的業(yè)務(wù)含義及其思維鏈放到大模型的記憶系統(tǒng)中,使之可以更靈活的滿足不同業(yè)務(wù)場(chǎng)景對(duì)查數(shù)、取數(shù)、分析的需求。這項(xiàng)技術(shù)不僅減少了人工編寫查詢語句的時(shí)間和勞動(dòng),而且降低了技術(shù)門檻,使得非技術(shù)人員也能通過自然語言與數(shù)據(jù)庫進(jìn)行交互。這促進(jìn)了數(shù)據(jù)分析的民主化,并支持企業(yè)更快地獲取數(shù)據(jù)支持,做出更加精準(zhǔn)和及時(shí)的決策。
隨著語義層的加入,系統(tǒng)的智能化程度得到了顯著提升,特別是在SQL準(zhǔn)確率方面。這種提升可以從幾個(gè)不同的層面來理解。首先,LLM(Large Language Model,大型語言模型)的原生理解力,也就是它在沒有額外語義信息的情況下對(duì)自然語言的理解能力,大約在30-50%的準(zhǔn)確率。然而,一旦引入了基礎(chǔ)的語義信息,比如字段級(jí)的語義描述,這個(gè)準(zhǔn)確率可以提升到大約70%。進(jìn)一步地,當(dāng)引入基于語義的業(yè)務(wù)含義描述,也就是表級(jí)語義描述時(shí),準(zhǔn)確率可以進(jìn)一步提高到85-100%。
在這個(gè)過程中,數(shù)據(jù)歸因與分析起到了關(guān)鍵作用。這涉及到對(duì)數(shù)據(jù)的理解,包括字段級(jí)和表級(jí)語義的描述,它們分別代表了數(shù)據(jù)的業(yè)務(wù)邏輯和更宏觀的數(shù)據(jù)含義。例如,一個(gè)字段可能代表某種特定的能耗數(shù)據(jù),而一個(gè)表則可能包含了整個(gè)組織級(jí)別的能耗數(shù)據(jù)。通過這種層次化的語義描述,系統(tǒng)能夠更準(zhǔn)確地解析用戶的問題并生成相應(yīng)的SQL查詢。
具體到用戶問題的處理,例如用戶詢問“今年的總能耗是多少?”時(shí),系統(tǒng)首先需要解析這個(gè)問題。這涉及到對(duì)問題中關(guān)鍵詞的理解,比如“今年”和“總能耗”,以及它們?cè)跇I(yè)務(wù)上的含義。在這個(gè)例子中,“今年”指的是從年初到當(dāng)前日期的時(shí)間范圍,“總能耗”則涉及到對(duì)特定字段,如year_total_quantity_coal的求和操作。接下來,系統(tǒng)需要確定數(shù)據(jù)來源,比如從哪個(gè)表中獲取數(shù)據(jù)。在這個(gè)例子中,數(shù)據(jù)來源于energy_composite_basic表。然后,系統(tǒng)需要根據(jù)業(yè)務(wù)邏輯構(gòu)建SQL查詢,這通常涉及到對(duì)特定條件的篩選,比如時(shí)間條件(今年)和組織類型(org_type=1),以及對(duì)特定字段的聚合操作,如求和。
此外,系統(tǒng)進(jìn)一步利用Dynamic few shot learning(動(dòng)態(tài)少樣本學(xué)習(xí))和COT(Chain of Thought,思維鏈)技術(shù),進(jìn)一步提升系統(tǒng)對(duì)用戶問題的理解和SQL查詢的準(zhǔn)確性,尤其是在數(shù)據(jù)質(zhì)量受限的情況下。
最終,不僅僅是技術(shù)層面的實(shí)現(xiàn),它還涉及到?jīng)Q策的落地與自主執(zhí)行。這意味著系統(tǒng)不僅要能夠理解用戶的問題并生成正確的SQL查詢,還要能夠?qū)⑦@個(gè)查詢執(zhí)行并返回結(jié)果,從而實(shí)現(xiàn)從理解到執(zhí)行的閉環(huán)。通過這種方式,系統(tǒng)能夠?yàn)橛脩籼峁└又悄芑妥詣?dòng)化的數(shù)據(jù)查詢服務(wù),實(shí)現(xiàn)問答是的關(guān)鍵詞模糊匹配、字段級(jí)澄清反問、智能圖表生成、分析摘要總結(jié)等特色能力。
智能工具調(diào)用技術(shù)(大模型調(diào)小模型)
通過理解自然語言描述的需求或指令,并將其轉(zhuǎn)換為相應(yīng)的工具調(diào)用(小模型服務(wù)),實(shí)現(xiàn)了業(yè)務(wù)流程的自動(dòng)化和用戶友好的交互體驗(yàn)。這項(xiàng)技術(shù)有助于提升用戶體驗(yàn),因?yàn)樗试S用戶通過自然語言與應(yīng)用程序交互,而無需學(xué)習(xí)復(fù)雜的操作流程或API使用方式。同時(shí),它也為企業(yè)提供了一個(gè)創(chuàng)新服務(wù)模式,通過開發(fā)基于自然語言的接口服務(wù),增強(qiáng)了企業(yè)的競(jìng)爭(zhēng)力。
在工具的選擇和調(diào)用階段,該系統(tǒng)通過對(duì)任務(wù)相關(guān)的領(lǐng)域知識(shí)進(jìn)行多模態(tài)召回,以此進(jìn)一步理解和確認(rèn)任務(wù)意圖,并最終匹配到對(duì)應(yīng)代理工具的執(zhí)行策略上,實(shí)現(xiàn)基于上下文領(lǐng)域知識(shí)的工具精準(zhǔn)調(diào)用與執(zhí)行。在召回階段通過:1)多路向量、關(guān)鍵字融合召回等方式,確保最大范圍的收集意圖任務(wù)相關(guān)的上下文信息;2)通過問題改寫、RRF倒數(shù)排序、reranker模型等方式,實(shí)現(xiàn)對(duì)意圖的最終排序,確認(rèn)意圖與已有知識(shí)的匹配優(yōu)先級(jí)。
在意圖識(shí)別階段通過:1)鏈路并行機(jī)制進(jìn)行大模型意圖確認(rèn);2)當(dāng)意圖存在歧義和關(guān)鍵信息缺失時(shí),則會(huì)利用澄清反問機(jī)制進(jìn)行意圖的再確認(rèn),直至大模型認(rèn)為已經(jīng)完全理解任務(wù)意圖(或放棄)。
其他技術(shù)點(diǎn)
企業(yè)級(jí)權(quán)限控制:在多廠區(qū)、多級(jí)別和不同角色的用戶環(huán)境中,權(quán)限控制是必不可少的。系統(tǒng)根據(jù)用戶的角色和權(quán)限,提供定制化的答案,確保用戶能夠無感知地獲取符合其權(quán)限范圍內(nèi)的知識(shí)。例如,高級(jí)別管理人員可以獲取更深層次的企業(yè)戰(zhàn)略信息,而現(xiàn)場(chǎng)工作人員則能夠獲得與其操作任務(wù)相關(guān)的實(shí)用信息,從而有效支持各級(jí)別人員的決策和操作。
混合LLM使用,兼顧推理能力與企業(yè)數(shù)據(jù)安全:結(jié)合公網(wǎng)大參數(shù)量模型的推理能力,與內(nèi)網(wǎng)數(shù)據(jù)安全的需求是制造業(yè)智能應(yīng)用的重要考量?;旌螸LM使用策略能夠有效地應(yīng)對(duì)復(fù)雜的場(chǎng)景需求,例如大規(guī)模問答、智能體工具調(diào)用等。通過確保敏感數(shù)據(jù)不出內(nèi)網(wǎng),同時(shí)靈活選擇不同鏈路上使用的大模型,企業(yè)能夠在維持?jǐn)?shù)據(jù)安全的同時(shí),充分利用大模型的強(qiáng)大推理和處理能力,提升生產(chǎn)效率和智能化程度。
超級(jí)入口:超級(jí)入口技術(shù)使智能體能夠自動(dòng)識(shí)別用戶意圖,并根據(jù)不同的對(duì)話場(chǎng)景無需顯式切換不同的對(duì)話應(yīng)用。這種技術(shù)提高了用戶體驗(yàn),使得用戶能夠更自然地與系統(tǒng)交互,無論是查詢數(shù)據(jù)、執(zhí)行任務(wù)還是獲取建議。
超級(jí)入口的智能策略和自動(dòng)匹配能力,為制造業(yè)提供了高效的操作和管理工具,進(jìn)一步提升了生產(chǎn)流程的智能化水平。
商業(yè)變化
隨著一二階段的合作成果落地,在人力資源和支撐性職能領(lǐng)域,數(shù)十萬名作業(yè)員和研發(fā)人員已經(jīng)可以通過統(tǒng)一的對(duì)話式入口,對(duì)公司政策、管理反饋、薪酬、休假等領(lǐng)域進(jìn)行詢問。以作業(yè)員為例,可極大程度的降低了對(duì)于系統(tǒng)使用的門檻。同時(shí),相比于傳統(tǒng)的提交工單系統(tǒng),極大程度的提升了員工關(guān)懷專員對(duì)于作業(yè)員反饋處理的效率。
隨著語義層的加入,系統(tǒng)的智能化程度得到了顯著提升,特別是在SQL準(zhǔn)確率方面。這種提升可以從幾個(gè)不同的層面來理解。首先,LLM(Large Language Model,大型語言模型)的原生理解力,也就是它在沒有額外語義信息的情況下對(duì)自然語言的理解能力,大約在30-50%的準(zhǔn)確率。然而,一旦引入了基礎(chǔ)的語義信息,比如字段級(jí)的語義描述,這個(gè)準(zhǔn)確率可以提升到大約70%。進(jìn)一步地,當(dāng)引入基于語義的業(yè)務(wù)含義描述,也就是表級(jí)語義描述時(shí),準(zhǔn)確率可以進(jìn)一步提高到85-100%。
在員工關(guān)懷相關(guān)的問答場(chǎng)景中,知識(shí)覆蓋度達(dá)46%(知識(shí)來源嚴(yán)格受限于知識(shí)庫內(nèi)),對(duì)于較為開放式的問答可實(shí)現(xiàn)76%的知識(shí)覆蓋度(允許利用大模型本身的知識(shí)進(jìn)行補(bǔ)充,常用于閑聊場(chǎng)景),并且在一個(gè)月的試用時(shí)間范圍內(nèi),由業(yè)務(wù)專家對(duì)回答質(zhì)量進(jìn)行抽查,未收到任何負(fù)反饋。
對(duì)于系統(tǒng)回答不知道的情況進(jìn)行統(tǒng)計(jì)分析后得出結(jié)論:
- 91.1%:知識(shí)庫內(nèi)并不存在相關(guān)知識(shí),需要知識(shí)運(yùn)營(yíng)人員基于相關(guān)話題判斷是否需要補(bǔ)充相關(guān)的領(lǐng)域知識(shí)
- 1.4%:?jiǎn)栴}是提問不明,例如“離職、投訴”,此處進(jìn)一步通過關(guān)聯(lián)問功能,讓系統(tǒng)引導(dǎo)用戶給出更為準(zhǔn)確的問題,如“離職手續(xù)怎么辦理?”
- 0.7%:專有名詞尚未加入配置項(xiàng),如員關(guān)=員工關(guān)愛中心、員工一站式服務(wù)中心,需要引導(dǎo)知識(shí)庫運(yùn)營(yíng)人員在產(chǎn)品中添加相關(guān)配置。
- 6.8%:相關(guān)語義存在識(shí)別問題,需要通過算法進(jìn)一步提高。楓清科技(Fabarta)通過產(chǎn)品本身,也可實(shí)現(xiàn)對(duì)bad case的自動(dòng)化收集,以持續(xù)性的提高回答準(zhǔn)確率。
關(guān)于企業(yè)
·楓清科技
楓清科技(Fabarta)是一家 AI 數(shù)據(jù)基礎(chǔ)設(shè)施公司,通過探索和聯(lián)結(jié)數(shù)據(jù)資源,助力企業(yè)實(shí)現(xiàn)智能驅(qū)動(dòng)的持續(xù)創(chuàng)新。在引擎層,打造面向 AI 的技術(shù)基礎(chǔ)設(shè)施,提供支持圖、向量和 AI 推理能力融合的 ArcNeural 多模態(tài)智能引擎;在平臺(tái)層,通過企業(yè)智能分析平臺(tái)加速可解釋圖智能和新一代AI技術(shù)在企業(yè)場(chǎng)景的落地,同時(shí)利用多模態(tài)數(shù)據(jù)編織平臺(tái)幫助企業(yè)梳理多模態(tài)的數(shù)據(jù)資產(chǎn),讓企業(yè)充分發(fā)揮數(shù)據(jù)流動(dòng)帶來的價(jià)值;此外,F(xiàn)abarta 可以基于多模態(tài)智能引擎、企業(yè)智能分析平臺(tái)和多模態(tài)數(shù)據(jù)編織平臺(tái)與客戶和伙伴一同構(gòu)建行業(yè)應(yīng)用,加速企業(yè)數(shù)智化轉(zhuǎn)型和 AI 技術(shù)的落地。
Fabarta
Fabarta是一家AI基礎(chǔ)設(shè)施公司,提供圖、向量和AI推理能力融合的ArcNeural多模態(tài)智能引擎,通過企業(yè)智能分析平臺(tái)加速圖智能在企業(yè)場(chǎng)景的落地,利用多模態(tài)數(shù)據(jù)編織平臺(tái)幫助企業(yè)梳理多模態(tài)的數(shù)據(jù)資產(chǎn),加速企業(yè)數(shù)智化轉(zhuǎn)型和AI技術(shù)落地。
·立臻科技
立臻(江蘇)有限公司于2020年11月25日成立,下設(shè)立臻科技(昆山)有限公司和立臻精密智造(昆山)有限公司,分別位于昆山綜合保稅區(qū)和昆山巴城鎮(zhèn)。立臻科技(昆山)有限公司,位于昆山綜合保稅區(qū),占地面積約225畝,已獲得國(guó)家級(jí)綠色工廠企業(yè)、江蘇省智能制造示范工廠等榮譽(yù)和稱號(hào)。主要從事移動(dòng)通信終端設(shè)備的研發(fā)生產(chǎn)制造及銷售,2022年產(chǎn)值約960億元。立臻精密智造(昆山)有限公司,位于昆山巴城鎮(zhèn),占地面積約840畝,主營(yíng)業(yè)務(wù)為通訊終端及零組件研發(fā)和智能制造。2022年開始投產(chǎn),全面投產(chǎn)后年產(chǎn)值超千億。
立臻科技
員工互動(dòng)、企業(yè)文化、投訴建議、企業(yè)動(dòng)態(tài)、人員招聘
★以上由楓清科技投遞申報(bào)的項(xiàng)目案例,最終將會(huì)角逐由數(shù)據(jù)猿與上海大數(shù)據(jù)聯(lián)盟聯(lián)合推出的《2024中國(guó)數(shù)智化轉(zhuǎn)型升級(jí)創(chuàng)新服務(wù)企業(yè)》榜單/獎(jiǎng)項(xiàng)。
該榜單最終將于7月24日北京舉辦的“2024企業(yè)數(shù)智化轉(zhuǎn)型升級(jí)發(fā)展論壇——暨AI大模型趨勢(shì)論壇”現(xiàn)場(chǎng)首次揭曉榜單,并舉行頒獎(jiǎng)儀式,歡迎報(bào)名蒞臨現(xiàn)場(chǎng)
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評(píng)論
不容錯(cuò)過的資訊
-
1《2024中國(guó)AI大模型產(chǎn)業(yè)圖譜1.0版》重磅
-
2繪就共商共享新畫卷,譜寫善治善智新篇章
-
3論壇預(yù)告|聯(lián)合國(guó)AI for Good峰會(huì)首次
-
4論壇預(yù)告|邀您參與WAIC 2024分論壇:泛
-
5WAIC 2024世界人工智能大會(huì)倒計(jì)時(shí)兩天
-
6WAIC特別專訪|北京大學(xué)周曉華:開發(fā)和推
-
7論壇預(yù)告|WAIC 2024數(shù)學(xué)與人工智能論壇
-
8論壇預(yù)告 | 2024世界人工智能大會(huì)因果
-
9美妝個(gè)護(hù)品牌數(shù)字生態(tài)大會(huì)暨未來營(yíng)銷大獎(jiǎng)
-
10論壇預(yù)告|華泰證券科技金融創(chuàng)新論壇預(yù)告
大數(shù)據(jù)企業(yè)推薦more >
大家都在搜
