【AI大模型展】達(dá)觀垂直大模型——更懂業(yè)務(wù)的大模型
達(dá)觀數(shù)據(jù) | 2024-07-11 21:14
【數(shù)據(jù)猿導(dǎo)讀】 該AI大模型由達(dá)觀數(shù)據(jù)投遞并參與數(shù)據(jù)猿與上海大數(shù)據(jù)聯(lián)盟聯(lián)合推出的《2024中國數(shù)智產(chǎn)業(yè)AI大模型先鋒企業(yè)》榜單/獎項”評選。

達(dá)觀垂直大模型
該AI大模型由達(dá)觀數(shù)據(jù)投遞并參與數(shù)據(jù)猿與上海大數(shù)據(jù)聯(lián)盟聯(lián)合推出的《2024中國數(shù)智產(chǎn)業(yè)AI大模型先鋒企業(yè)》榜單/獎項”評選。
達(dá)觀數(shù)據(jù)的垂直大模型是一款國產(chǎn)大型語言模型,專為垂直領(lǐng)域定制。通過并聯(lián)多種模型,支持專業(yè)文檔寫作、知識檢索、知識問答、文檔審核等場景。擁有高質(zhì)量行業(yè)數(shù)據(jù)混合增量預(yù)訓(xùn)練構(gòu)建強(qiáng)大垂域基座,擁有文檔審閱、知識增強(qiáng)檢索、專業(yè)寫作、資訊解讀、對話分析5大類100+細(xì)分場景沉淀指令數(shù)據(jù),通過通用指令、NLP指令、垂直領(lǐng)域指令微調(diào)激活大模型專業(yè)場景應(yīng)用處理能力,成為更懂實際業(yè)務(wù)的大模型。目前已通過國家網(wǎng)信辦第三批生成式人工智能服務(wù)備案。
應(yīng)用場景/使用群體
應(yīng)用場景一:知識庫高級應(yīng)用
達(dá)觀新一代智能知識管理系統(tǒng)(KMS)以自主研發(fā)的“曹植”大語言模型為核心,融合了知識圖譜、自然語言處理、多模態(tài)知識挖掘等尖端AI技術(shù)。該系統(tǒng)具備知識生產(chǎn)、組織、搜索、問答、圖譜構(gòu)建和社區(qū)管理六大功能,能夠?qū)⑵髽I(yè)積累的大量結(jié)構(gòu)化和非結(jié)構(gòu)化文檔通過先進(jìn)的自然語言技術(shù)進(jìn)行處理和提煉,構(gòu)建一個更加智能化和人性化的知識管理體系。這一系統(tǒng)將廣泛應(yīng)用于企業(yè)文檔管理、研發(fā)知識管理、制度管理和合同管理等多個場景,助力企業(yè)用戶實現(xiàn)知識的快速獲取、高效共享、便捷應(yīng)用和持續(xù)創(chuàng)新。
應(yīng)用場景二:數(shù)字員工
無論是在企業(yè)內(nèi)部流程優(yōu)化,還是在客戶服務(wù)改善方面,數(shù)字員工都具備驚人的潛力。例如,在知識檢索與整合智能的場景中,達(dá)觀Agent可以通過訪問和理解海量的知識庫,為用戶提供準(zhǔn)確的信息檢索和整合服務(wù),支持決策和問題解決。在財務(wù)與會計的日常業(yè)務(wù)中,達(dá)觀Agent夠自動執(zhí)行財務(wù)數(shù)據(jù)錄入、賬目核對和報表生成等任務(wù),簡化財務(wù)流程。在面對客戶服務(wù)和支持方面,達(dá)觀Agent可以用于在線客服和支持系統(tǒng),處理常見問題并提供實時幫助,同時還能夠?qū)W習(xí)和優(yōu)化以應(yīng)對更加復(fù)雜的需求。達(dá)觀Agent還可以提供個性化的培訓(xùn)建議和學(xué)習(xí)路徑,幫助員工提升技能和職業(yè)發(fā)展,助理企業(yè)員工的培訓(xùn)與發(fā)展。同時在員工招聘方面,智能數(shù)字員工可以篩選簡歷、安排面試日程,提高招聘流程的效率和精度等。
產(chǎn)品功能
達(dá)觀垂直大模型主要根據(jù)客戶的知識庫系統(tǒng)和特定的文本處理場景部署,主要服務(wù)場景和功能如下:
數(shù)據(jù)庫問答:
達(dá)觀智能知識庫問答針對企業(yè)內(nèi)部知識庫的內(nèi)容進(jìn)行解答,實現(xiàn)更智能更精準(zhǔn)獲取專家級知識。
知識庫問答:
達(dá)觀智能知識庫問答,智能開發(fā)自然語言轉(zhuǎn)SQL語言技術(shù),充分利用大模型的能力,為企業(yè)提供自助式數(shù)據(jù)庫智能查詢服務(wù)。
垂直文本寫作:
達(dá)觀智能知識庫支持智能文本寫作,可滿足企業(yè)日益增長的個性化和專業(yè)文檔寫作需求,例如標(biāo)書、債券募集書、審計報告、企業(yè)運營周報等。
智能審核:
達(dá)觀智能知識庫基于大模型能力,例如,可自動審核招股書是否滿足相關(guān)外規(guī)內(nèi)規(guī)文件的要求,審核點主要包括了披露內(nèi)容的全面性,以及基礎(chǔ)核查項。
達(dá)觀Agent:
達(dá)觀智能數(shù)字員工巧妙地融合了機(jī)器人流程自動化(RPA)的高效執(zhí)行能力和“曹植大模型”的先進(jìn)語義理解技術(shù)。RPA作為數(shù)字員工的執(zhí)行核心,自動化處理重復(fù)性任務(wù),而曹植大模型則賦予其理解復(fù)雜語言和任務(wù)規(guī)劃的能力,使得數(shù)字員工能夠精準(zhǔn)捕捉并響應(yīng)用戶需求。此外,通過知識管理系統(tǒng),數(shù)字員工能夠存儲和利用歷史數(shù)據(jù),優(yōu)化任務(wù)執(zhí)行策略。這種結(jié)合不僅提升了企業(yè)運營的效率,還可推動業(yè)務(wù)流程的智能化和自動化。
產(chǎn)品優(yōu)勢
達(dá)觀垂直大模型是“混合模型+垂直知識+場景應(yīng)用”,它兼容了多種基座模型,不僅有自有的“曹植”大模型以及第三方基座模型如百川、智譜、Llama等,方便兼容并包、實用性強(qiáng)。"曹植"大模型以其在長文本處理領(lǐng)域的專業(yè)能力而聞名。它擅長長文檔的寫作、審核、潤色和翻譯,能夠自動完成多類型、復(fù)雜結(jié)構(gòu)的長文本創(chuàng)作。無論是撰寫白皮書、技術(shù)報告還是品牌故事,曹植大模型都能提供流暢、高質(zhì)量的文案服務(wù)。同時,它還積累了豐富的高質(zhì)量行業(yè)數(shù)據(jù),通過混合專家系統(tǒng)和垂直精調(diào)訓(xùn)練(SFT),讓大模型更懂業(yè)務(wù),賦能更多專業(yè)場景來量身打造專業(yè)報告寫作、行業(yè)規(guī)則下的文檔審閱、專業(yè)Agent助手和行業(yè)屬性強(qiáng)相關(guān)的智能應(yīng)用產(chǎn)品,現(xiàn)場可以演示專業(yè)化的業(yè)務(wù)問答、行業(yè)專屬報告寫作和業(yè)務(wù)規(guī)則的審閱等。達(dá)觀數(shù)據(jù)堅持自主可控的訓(xùn)練數(shù)據(jù)和算法模型,與國產(chǎn)GPU實現(xiàn)聯(lián)調(diào)對接,提供"算力+模型"的全套國產(chǎn)化信創(chuàng)方案,推動行業(yè)創(chuàng)新與發(fā)展。"曹植"大模型,賦能百業(yè),引領(lǐng)長文本處理和多語言服務(wù)的新篇章。
技術(shù)說明
達(dá)觀數(shù)據(jù)自研的"曹植"大語言模型是專為國產(chǎn)化需求而設(shè)計的AI解決方案。它不僅堅持自主可控的訓(xùn)練數(shù)據(jù)和算法模型,還實現(xiàn)了與國產(chǎn)GPU的深度聯(lián)調(diào)對接,為眾多合作伙伴提供了"算力+模型"的全套國產(chǎn)化信創(chuàng)方案。是基于對國內(nèi)AI加速卡和GPU市場的深入研究和適配。它完美適配了華為昇騰、燧原、海光等國內(nèi)主流AI加速卡和GPU,確保了在不同硬件平臺上都能發(fā)揮出最佳性能。
在技術(shù)層面,"曹植"大模型整合了ElasticSearch搜索、OCR、NLP、推薦算法等先進(jìn)技術(shù),實現(xiàn)了多源異構(gòu)數(shù)據(jù)的整合分析。這種數(shù)據(jù)整合能力,使得企業(yè)能夠更高效地管理和利用數(shù)據(jù)資源,提高數(shù)據(jù)的利用效率和價值。
1、混合專家(MoE)模型
將模型分為若干個專家模塊,每個專家負(fù)責(zé)處理數(shù)據(jù)的一部分。一個門控機(jī)制負(fù)責(zé)動態(tài)選擇哪個專家模塊應(yīng)該負(fù)責(zé)當(dāng)前輸入數(shù)據(jù)。充分兼容百川、智譜等第三方模型,模型落地性效果好、實用性強(qiáng)。
2、自適應(yīng)檢索增強(qiáng)生成
基于自適應(yīng)檢索增強(qiáng)生成技術(shù),知識管理系統(tǒng)實現(xiàn)了對非結(jié)構(gòu)化文檔、數(shù)據(jù)路、業(yè)務(wù)系統(tǒng)等多種數(shù)據(jù)源進(jìn)行問答,系統(tǒng)框架內(nèi)置文檔、NL2SQL、NL2DATA等自適應(yīng)路由RAG能力支持。
3、檢索增強(qiáng)生成技術(shù)深化
增強(qiáng)大語言模型處理問答場景的準(zhǔn)確性、穩(wěn)定性和安全性,讓問答產(chǎn)品遷移到不同的業(yè)務(wù)場景有更強(qiáng)的優(yōu)秀的效果。同時處理的信息存儲對象擴(kuò)充到更多形態(tài)類型。
4、復(fù)雜文檔理解
使用大型語言模型的優(yōu)勢來輔助理解視覺豐富的文檔圖像來實現(xiàn)更強(qiáng)大的布局感知和內(nèi)容理解。同時,更精確的文檔結(jié)構(gòu)解析反過來也能更好幫助大模型理解文檔內(nèi)容提高下游任務(wù)效果。
5、多模態(tài)圖表問答
綜合視覺信息和語言理解能力,使得大模型能夠理解復(fù)雜圖表和圖像中的信息,對其中的數(shù)據(jù)進(jìn)行分析歸納和總結(jié),回答用戶查詢提到的問題。
6、低代碼智能體開發(fā)
將RPA和大模型Agent能力深度融合,使得非技術(shù)用戶也能夠通過自然語言處理和人工智能能力構(gòu)建自動化流程。
此外,"曹植"大模型還推出了私有化大模型一體機(jī),完成了全體系的軟硬件及配套框架的適配。為企業(yè)提供了更加靈活和安全的部署選項。這種私有化部署方式,既滿足了企業(yè)對數(shù)據(jù)安全和隱私保護(hù)的需求,又能夠根據(jù)企業(yè)的實際情況進(jìn)行定制化開發(fā)和優(yōu)化。
服務(wù)客戶
達(dá)觀智能知識庫目前已對接南方航空、中國移動、中國建設(shè)銀行、微創(chuàng)醫(yī)療等來自交通、通信、金融、醫(yī)療等多家行業(yè)頭部企業(yè)。廣泛應(yīng)用于企業(yè)文檔管理、研發(fā)知識管理、制度管理和合同管理等多個場景,助力企業(yè)用戶實現(xiàn)知識的快速獲取、高效共享、便捷應(yīng)用和持續(xù)創(chuàng)新。
關(guān)于企業(yè)
·達(dá)觀數(shù)據(jù)
達(dá)觀數(shù)據(jù),國家級專精特新“小巨人”企業(yè),榮獲“吳文俊人工智能獎”等多項榮譽(yù),是行業(yè)領(lǐng)先的智能知識管理和文本處理提供商。達(dá)觀數(shù)據(jù)2015年底成立,專注于各類文本智能處理系統(tǒng)的開發(fā),針對企業(yè)內(nèi)部文檔做抽取、審核、比對;文檔的管理、問答、寫作、搜索推薦;以及跨系統(tǒng)之間的數(shù)據(jù)自動同步,抓取,填報等。通過自研核心技術(shù),助力企業(yè)提升文檔處理效率,確保內(nèi)容準(zhǔn)確性,每家企業(yè)均可部署專屬系統(tǒng),實現(xiàn)個性化智能辦公。
達(dá)觀數(shù)據(jù)
達(dá)觀數(shù)據(jù)專注智能知識管理軟件系統(tǒng)開發(fā),廣泛應(yīng)用于各類知識管理業(yè)務(wù)的智能化,其自主研發(fā)的智能知識管理系統(tǒng)(KMS)、智能文本處理技術(shù)(IDP)、智能寫作、智能圖像識別(OCR)、機(jī)器人流程自動化(RPA)、智能搜索推薦等產(chǎn)品,成功賦能百業(yè)。
★以上由達(dá)觀數(shù)據(jù)投遞申報的項目案例,最終將會角逐由數(shù)據(jù)猿與上海大數(shù)據(jù)聯(lián)盟聯(lián)合推出的《2024中國數(shù)智產(chǎn)業(yè)AI大模型先鋒企業(yè)》榜單/獎項。
該榜單最終將于7月24日北京舉辦的“2024企業(yè)數(shù)智化轉(zhuǎn)型升級發(fā)展論壇——暨AI大模型趨勢論壇”現(xiàn)場首次揭曉榜單,并舉行頒獎儀式,歡迎報名蒞臨現(xiàn)場
來源:數(shù)據(jù)猿