【AI大模型展】達(dá)觀垂直大模型——更懂業(yè)務(wù)的大模型

AI大模型達(dá)觀垂直大模型

達(dá)觀數(shù)據(jù) | 2024-07-11 21:14

【數(shù)據(jù)猿導(dǎo)讀】該AI大模型由達(dá)觀數(shù)據(jù)投遞并參與數(shù)據(jù)猿與上海大數(shù)據(jù)聯(lián)盟聯(lián)合推出的《2024中國數(shù)智產(chǎn)業(yè)AI大模型先鋒企業(yè)》榜單/獎項”評選。

達(dá)觀垂直大模型

該AI大模型由達(dá)觀數(shù)據(jù)投遞并參與數(shù)據(jù)猿與上海大數(shù)據(jù)聯(lián)盟聯(lián)合推出的《2024中國數(shù)智產(chǎn)業(yè)AI大模型先鋒企業(yè)》榜單/獎項”評選。

達(dá)觀數(shù)據(jù)的垂直大模型是一款國產(chǎn)大型語言模型，專為垂直領(lǐng)域定制。通過并聯(lián)多種模型，支持專業(yè)文檔寫作、知識檢索、知識問答、文檔審核等場景。擁有高質(zhì)量行業(yè)數(shù)據(jù)混合增量預(yù)訓(xùn)練構(gòu)建強(qiáng)大垂域基座，擁有文檔審閱、知識增強(qiáng)檢索、專業(yè)寫作、資訊解讀、對話分析5大類100+細(xì)分場景沉淀指令數(shù)據(jù)，通過通用指令、NLP指令、垂直領(lǐng)域指令微調(diào)激活大模型專業(yè)場景應(yīng)用處理能力，成為更懂實際業(yè)務(wù)的大模型。目前已通過國家網(wǎng)信辦第三批生成式人工智能服務(wù)備案。

應(yīng)用場景/使用群體

應(yīng)用場景一：知識庫高級應(yīng)用

達(dá)觀新一代智能知識管理系統(tǒng)（KMS）以自主研發(fā)的“曹植”大語言模型為核心，融合了知識圖譜、自然語言處理、多模態(tài)知識挖掘等尖端AI技術(shù)。該系統(tǒng)具備知識生產(chǎn)、組織、搜索、問答、圖譜構(gòu)建和社區(qū)管理六大功能，能夠?qū)⑵髽I(yè)積累的大量結(jié)構(gòu)化和非結(jié)構(gòu)化文檔通過先進(jìn)的自然語言技術(shù)進(jìn)行處理和提煉，構(gòu)建一個更加智能化和人性化的知識管理體系。這一系統(tǒng)將廣泛應(yīng)用于企業(yè)文檔管理、研發(fā)知識管理、制度管理和合同管理等多個場景，助力企業(yè)用戶實現(xiàn)知識的快速獲取、高效共享、便捷應(yīng)用和持續(xù)創(chuàng)新。

應(yīng)用場景二：數(shù)字員工

無論是在企業(yè)內(nèi)部流程優(yōu)化，還是在客戶服務(wù)改善方面，數(shù)字員工都具備驚人的潛力。例如，在知識檢索與整合智能的場景中，達(dá)觀Agent可以通過訪問和理解海量的知識庫，為用戶提供準(zhǔn)確的信息檢索和整合服務(wù)，支持決策和問題解決。在財務(wù)與會計的日常業(yè)務(wù)中，達(dá)觀Agent夠自動執(zhí)行財務(wù)數(shù)據(jù)錄入、賬目核對和報表生成等任務(wù)，簡化財務(wù)流程。在面對客戶服務(wù)和支持方面，達(dá)觀Agent可以用于在線客服和支持系統(tǒng)，處理常見問題并提供實時幫助，同時還能夠?qū)W習(xí)和優(yōu)化以應(yīng)對更加復(fù)雜的需求。達(dá)觀Agent還可以提供個性化的培訓(xùn)建議和學(xué)習(xí)路徑，幫助員工提升技能和職業(yè)發(fā)展，助理企業(yè)員工的培訓(xùn)與發(fā)展。同時在員工招聘方面，智能數(shù)字員工可以篩選簡歷、安排面試日程，提高招聘流程的效率和精度等。

產(chǎn)品功能

達(dá)觀垂直大模型主要根據(jù)客戶的知識庫系統(tǒng)和特定的文本處理場景部署，主要服務(wù)場景和功能如下：

數(shù)據(jù)庫問答：

AI大模型_達(dá)觀_垂直大模型-1

達(dá)觀智能知識庫問答針對企業(yè)內(nèi)部知識庫的內(nèi)容進(jìn)行解答，實現(xiàn)更智能更精準(zhǔn)獲取專家級知識。

知識庫問答：

AI大模型_達(dá)觀_垂直大模型-2

達(dá)觀智能知識庫問答，智能開發(fā)自然語言轉(zhuǎn)SQL語言技術(shù)，充分利用大模型的能力，為企業(yè)提供自助式數(shù)據(jù)庫智能查詢服務(wù)。

垂直文本寫作：

AI大模型_達(dá)觀_垂直大模型-3

達(dá)觀智能知識庫支持智能文本寫作，可滿足企業(yè)日益增長的個性化和專業(yè)文檔寫作需求，例如標(biāo)書、債券募集書、審計報告、企業(yè)運營周報等。

智能審核：

AI大模型_達(dá)觀_垂直大模型-4

達(dá)觀智能知識庫基于大模型能力，例如，可自動審核招股書是否滿足相關(guān)外規(guī)內(nèi)規(guī)文件的要求，審核點主要包括了披露內(nèi)容的全面性，以及基礎(chǔ)核查項。

達(dá)觀Agent：

AI大模型_達(dá)觀_垂直大模型-5

達(dá)觀智能數(shù)字員工巧妙地融合了機(jī)器人流程自動化（RPA）的高效執(zhí)行能力和“曹植大模型”的先進(jìn)語義理解技術(shù)。RPA作為數(shù)字員工的執(zhí)行核心，自動化處理重復(fù)性任務(wù)，而曹植大模型則賦予其理解復(fù)雜語言和任務(wù)規(guī)劃的能力，使得數(shù)字員工能夠精準(zhǔn)捕捉并響應(yīng)用戶需求。此外，通過知識管理系統(tǒng)，數(shù)字員工能夠存儲和利用歷史數(shù)據(jù)，優(yōu)化任務(wù)執(zhí)行策略。這種結(jié)合不僅提升了企業(yè)運營的效率，還可推動業(yè)務(wù)流程的智能化和自動化。

產(chǎn)品優(yōu)勢

達(dá)觀垂直大模型是“混合模型+垂直知識+場景應(yīng)用”，它兼容了多種基座模型，不僅有自有的“曹植”大模型以及第三方基座模型如百川、智譜、Llama等，方便兼容并包、實用性強(qiáng)。"曹植"大模型以其在長文本處理領(lǐng)域的專業(yè)能力而聞名。它擅長長文檔的寫作、審核、潤色和翻譯，能夠自動完成多類型、復(fù)雜結(jié)構(gòu)的長文本創(chuàng)作。無論是撰寫白皮書、技術(shù)報告還是品牌故事，曹植大模型都能提供流暢、高質(zhì)量的文案服務(wù)。同時，它還積累了豐富的高質(zhì)量行業(yè)數(shù)據(jù)，通過混合專家系統(tǒng)和垂直精調(diào)訓(xùn)練（SFT），讓大模型更懂業(yè)務(wù)，賦能更多專業(yè)場景來量身打造專業(yè)報告寫作、行業(yè)規(guī)則下的文檔審閱、專業(yè)Agent助手和行業(yè)屬性強(qiáng)相關(guān)的智能應(yīng)用產(chǎn)品，現(xiàn)場可以演示專業(yè)化的業(yè)務(wù)問答、行業(yè)專屬報告寫作和業(yè)務(wù)規(guī)則的審閱等。達(dá)觀數(shù)據(jù)堅持自主可控的訓(xùn)練數(shù)據(jù)和算法模型，與國產(chǎn)GPU實現(xiàn)聯(lián)調(diào)對接，提供"算力+模型"的全套國產(chǎn)化信創(chuàng)方案，推動行業(yè)創(chuàng)新與發(fā)展。"曹植"大模型，賦能百業(yè)，引領(lǐng)長文本處理和多語言服務(wù)的新篇章。

技術(shù)說明

達(dá)觀數(shù)據(jù)自研的"曹植"大語言模型是專為國產(chǎn)化需求而設(shè)計的AI解決方案。它不僅堅持自主可控的訓(xùn)練數(shù)據(jù)和算法模型，還實現(xiàn)了與國產(chǎn)GPU的深度聯(lián)調(diào)對接，為眾多合作伙伴提供了"算力+模型"的全套國產(chǎn)化信創(chuàng)方案。是基于對國內(nèi)AI加速卡和GPU市場的深入研究和適配。它完美適配了華為昇騰、燧原、海光等國內(nèi)主流AI加速卡和GPU，確保了在不同硬件平臺上都能發(fā)揮出最佳性能。

在技術(shù)層面，"曹植"大模型整合了ElasticSearch搜索、OCR、NLP、推薦算法等先進(jìn)技術(shù)，實現(xiàn)了多源異構(gòu)數(shù)據(jù)的整合分析。這種數(shù)據(jù)整合能力，使得企業(yè)能夠更高效地管理和利用數(shù)據(jù)資源，提高數(shù)據(jù)的利用效率和價值。

1、混合專家（MoE）模型

將模型分為若干個專家模塊，每個專家負(fù)責(zé)處理數(shù)據(jù)的一部分。一個門控機(jī)制負(fù)責(zé)動態(tài)選擇哪個專家模塊應(yīng)該負(fù)責(zé)當(dāng)前輸入數(shù)據(jù)。充分兼容百川、智譜等第三方模型，模型落地性效果好、實用性強(qiáng)。

2、自適應(yīng)檢索增強(qiáng)生成

基于自適應(yīng)檢索增強(qiáng)生成技術(shù)，知識管理系統(tǒng)實現(xiàn)了對非結(jié)構(gòu)化文檔、數(shù)據(jù)路、業(yè)務(wù)系統(tǒng)等多種數(shù)據(jù)源進(jìn)行問答，系統(tǒng)框架內(nèi)置文檔、NL2SQL、NL2DATA等自適應(yīng)路由RAG能力支持。

3、檢索增強(qiáng)生成技術(shù)深化

增強(qiáng)大語言模型處理問答場景的準(zhǔn)確性、穩(wěn)定性和安全性，讓問答產(chǎn)品遷移到不同的業(yè)務(wù)場景有更強(qiáng)的優(yōu)秀的效果。同時處理的信息存儲對象擴(kuò)充到更多形態(tài)類型。

4、復(fù)雜文檔理解

使用大型語言模型的優(yōu)勢來輔助理解視覺豐富的文檔圖像來實現(xiàn)更強(qiáng)大的布局感知和內(nèi)容理解。同時，更精確的文檔結(jié)構(gòu)解析反過來也能更好幫助大模型理解文檔內(nèi)容提高下游任務(wù)效果。

5、多模態(tài)圖表問答

綜合視覺信息和語言理解能力，使得大模型能夠理解復(fù)雜圖表和圖像中的信息，對其中的數(shù)據(jù)進(jìn)行分析歸納和總結(jié)，回答用戶查詢提到的問題。

6、低代碼智能體開發(fā)

將RPA和大模型Agent能力深度融合，使得非技術(shù)用戶也能夠通過自然語言處理和人工智能能力構(gòu)建自動化流程。

此外，"曹植"大模型還推出了私有化大模型一體機(jī)，完成了全體系的軟硬件及配套框架的適配。為企業(yè)提供了更加靈活和安全的部署選項。這種私有化部署方式，既滿足了企業(yè)對數(shù)據(jù)安全和隱私保護(hù)的需求，又能夠根據(jù)企業(yè)的實際情況進(jìn)行定制化開發(fā)和優(yōu)化。

服務(wù)客戶

達(dá)觀智能知識庫目前已對接南方航空、中國移動、中國建設(shè)銀行、微創(chuàng)醫(yī)療等來自交通、通信、金融、醫(yī)療等多家行業(yè)頭部企業(yè)。廣泛應(yīng)用于企業(yè)文檔管理、研發(fā)知識管理、制度管理和合同管理等多個場景，助力企業(yè)用戶實現(xiàn)知識的快速獲取、高效共享、便捷應(yīng)用和持續(xù)創(chuàng)新。

關(guān)于企業(yè)

·達(dá)觀數(shù)據(jù)

達(dá)觀數(shù)據(jù)，國家級專精特新“小巨人”企業(yè)，榮獲“吳文俊人工智能獎”等多項榮譽(yù)，是行業(yè)領(lǐng)先的智能知識管理和文本處理提供商。達(dá)觀數(shù)據(jù)2015年底成立，專注于各類文本智能處理系統(tǒng)的開發(fā)，針對企業(yè)內(nèi)部文檔做抽取、審核、比對；文檔的管理、問答、寫作、搜索推薦；以及跨系統(tǒng)之間的數(shù)據(jù)自動同步，抓取，填報等。通過自研核心技術(shù)，助力企業(yè)提升文檔處理效率，確保內(nèi)容準(zhǔn)確性，每家企業(yè)均可部署專屬系統(tǒng)，實現(xiàn)個性化智能辦公。

達(dá)觀數(shù)據(jù)

達(dá)觀數(shù)據(jù)專注智能知識管理軟件系統(tǒng)開發(fā)，廣泛應(yīng)用于各類知識管理業(yè)務(wù)的智能化，其自主研發(fā)的智能知識管理系統(tǒng)（KMS）、智能文本處理技術(shù)（IDP）、智能寫作、智能圖像識別（OCR）、機(jī)器人流程自動化（RPA）、智能搜索推薦等產(chǎn)品，成功賦能百業(yè)。

★以上由達(dá)觀數(shù)據(jù)投遞申報的項目案例，最終將會角逐由數(shù)據(jù)猿與上海大數(shù)據(jù)聯(lián)盟聯(lián)合推出的《2024中國數(shù)智產(chǎn)業(yè)AI大模型先鋒企業(yè)》榜單/獎項。

該榜單最終將于7月24日北京舉辦的“2024企業(yè)數(shù)智化轉(zhuǎn)型升級發(fā)展論壇——暨AI大模型趨勢論壇”現(xiàn)場首次揭曉榜單，并舉行頒獎儀式，歡迎報名蒞臨現(xiàn)場

來源：數(shù)據(jù)猿

收藏分享

聲明：數(shù)據(jù)猿尊重媒體行業(yè)規(guī)范，相關(guān)內(nèi)容都會注明來源與作者；轉(zhuǎn)載我們原創(chuàng)內(nèi)容時，也請務(wù)必注明“來源：數(shù)據(jù)猿”與作者名稱，否則將會受到數(shù)據(jù)猿追責(zé)。