#榜樣的力量#天璣數(shù)據(jù)大腦疫情風險感知預警平臺“智疫通”丨數(shù)據(jù)猿新冠戰(zhàn)“疫”公益策劃
原創(chuàng) 中科天璣 | 2020-07-10 12:08
【數(shù)據(jù)猿導讀】 “智疫通”能夠近乎真實反映流行周期內(nèi)的疫情速度趨勢,及時了解話題態(tài)勢和熱點關注,溯源傳染源聚集地和潛在受感染者,在疫情期間被廣泛應用,為科學防治、精準施策提供數(shù)據(jù)支撐,服務于國家政府部門和大眾。

“該項目案例由中科天璣數(shù)據(jù)科技股份有限公司(簡稱:中科天璣)提交申報,參與數(shù)據(jù)猿推出的《尋找新冠戰(zhàn)“疫”,中國數(shù)據(jù)智能產(chǎn)業(yè)先鋒力量》的公益主題策劃活動。
疫情期間,大數(shù)據(jù)、人工智能、5G等數(shù)字技術的應用,成為抗擊疫情的“新式武器”。天璣數(shù)據(jù)大腦疫情風險感知預警平臺“智疫通”為公眾提供疫情趨勢智能預測、智能問答、態(tài)勢分析、風險感知、信息速遞等各類相關權威內(nèi)容及助理服務。
“智疫通”能夠近乎真實反映流行周期內(nèi)的疫情速度趨勢,及時了解話題態(tài)勢和熱點關注,溯源傳染源聚集地和潛在受感染者,在疫情期間被廣泛應用,為科學防治、精準施策提供數(shù)據(jù)支撐,服務于國家政府部門和大眾。
目前,“智疫通”已通過發(fā)布疫情預報、政企合作、實踐教學等形式對外推廣。
項目開發(fā)起止時間:2020年2月4日啟動,2月8日上線。
應用場景
一是對互聯(lián)網(wǎng)海量多源異構數(shù)據(jù)實時采集、分析、監(jiān)測,采用自主研發(fā)的自增強泊松過程模型預測疫情態(tài)勢,基于深度語義匹配技術支持疫情防護知識傳播,對病患行為軌跡、治療藥物研究等維度進行時空關聯(lián)圖譜分析,為有關部門提供疫情傳播規(guī)律與風險感知預警,助力精準復工復產(chǎn);
二是依托“天璣數(shù)據(jù)大腦智能機器學習平臺”及相關教學資源,培養(yǎng)學生成為大數(shù)據(jù)分析人才,科技助力“復學復課”;
三是支撐安防等部門對互聯(lián)網(wǎng)輿情有效監(jiān)測,通過自然語言理解算法和模型,應用互聯(lián)網(wǎng)海量多源異構數(shù)據(jù)的深度分析與挖掘,形成人腦決策和計算機智能共生的大數(shù)據(jù)分析環(huán)境及工具系統(tǒng),萃取重大戰(zhàn)略情報;
四是為行業(yè)開發(fā)者提供開放式應用開發(fā)平臺,在金融、能源、工業(yè)制造等傳統(tǒng)行業(yè),依托該平臺快速構建智能算法和模型,提升傳統(tǒng)行業(yè)效能,構建大數(shù)據(jù)智能技術生態(tài),加速企業(yè)在各業(yè)務場景的落地,賦能大數(shù)據(jù)企業(yè)復工復產(chǎn)。
面臨挑戰(zhàn)
疫情過后,經(jīng)濟增長會面臨更大的壓力。整個社會將重新審視數(shù)字技術的價值和企業(yè)的社會責任感,中科天璣作為大數(shù)據(jù)企業(yè)更感受到了技術創(chuàng)新的緊迫性和使命感。大數(shù)據(jù)、人工智能不僅僅在應對突發(fā)公共事件,公共安全治理、提升城市運行效率,醫(yī)療技術攻堅等關鍵領域大有可為,在更廣闊的產(chǎn)業(yè)領域,在幫助各行各業(yè)智能化升級方面,更將發(fā)揮核心引擎的作用。如何將積累的大數(shù)據(jù)、人工智能技術快速應用到疫情場景,將大數(shù)據(jù)賦能防疫及重大災害,是疫情帶給科技企業(yè)的靈魂考題。
一是全新的理論挑戰(zhàn)。面對突如其來的新型病毒肆虐,在疫情初期醫(yī)學對病毒的研究尚未得到權威結論的情況下,經(jīng)典傳染病傳播模型SEIR并不能完全準確的反應疫情走勢。因此,何種理論模型能夠基于現(xiàn)有數(shù)據(jù)以及病毒特點進行疫情精準分析,是研發(fā)過程中亟需解決的問題。經(jīng)過多番論證及優(yōu)化后,團隊提出自增強泊松過程(Reinforced Poisson Process)模型對此次疫情傳播趨勢進行分析和預測。
二是全新的團隊協(xié)作。疫情爆發(fā)初期正值春節(jié)假期,但為公眾和政府提供風險預測預警刻不容緩。中科天璣產(chǎn)品研發(fā)團隊從正月初六就開始連軸轉,從最初的設計構想不斷完善成為精準可用的疫情風險感知預警平臺,向社會展示了科技型企業(yè)賦能抗議及重大災害中的積極作用。
三是全新的用戶領域。中科天璣長期服務于黨政軍行業(yè)用戶,“智疫通”抗疫平臺將原本應用在宣傳、網(wǎng)信、安全、政法、軍工等領域的大數(shù)據(jù)智能技術快速應用到疫情場景,面向公眾和政府提供準確可靠的信息服務,并根據(jù)疫情演變情況,進一步研發(fā)拓展其功能,數(shù)據(jù)不僅覆蓋國家衛(wèi)健委、各地衛(wèi)健委、權威媒體官網(wǎng)的公開信息,更依托“天璣數(shù)據(jù)大腦”,不斷學習矯正,確保數(shù)據(jù)信息安全可靠、實時全面。
實施過程
天璣數(shù)據(jù)大腦在基礎設施平臺層面,把共性技術整合成技術平臺,從數(shù)據(jù)采集、存儲、治理到算法模型,打造云、大數(shù)據(jù)、智能服務的融合共性平臺,支撐企業(yè)級大數(shù)據(jù)智能應用。
“智疫通”基于天璣數(shù)據(jù)大腦,整合天璣數(shù)據(jù)采集平臺(WDE)、大數(shù)據(jù)存儲管理平臺(BDE)、智能機器學習系統(tǒng)(BDA)、輿情監(jiān)測系統(tǒng)(TechRoute)和智能情報分析系統(tǒng)(GoIN)等技術,提供“智能預測”、“智能問答”、“態(tài)勢分析”、”風險感知”、“信息速遞”等服務,幫助國家政府部門和大眾針對疫情感知、分析、預測、行動,根據(jù)疫情發(fā)展態(tài)勢采取有效防控防護措施并進行實時調整,隨時獲取相關指導信息。
1 自增強泊松過程的智能預測技術
可視化智能機器學習系統(tǒng)(BDA)是集數(shù)據(jù)預處理、模型訓練、預測、評估、應用發(fā)布為一體的一站式大數(shù)據(jù)智能分析挖掘平臺。“智能預測”功能基于天璣智能機器學習系統(tǒng)(BDA)生成,采用自增強泊松過程(Reinforced Poisson Process)預測模型對此次疫情傳播趨勢進行分析和預測。
該預測模型根據(jù)以下三個微觀機制的影響來建模個體被病毒感染并發(fā)病這一疫情傳播的動態(tài)過程:1)病毒傳染性,即病毒自身的傳染性對最終的感染人數(shù)起決定作用;2)級聯(lián)傳播所帶來的自增強效應,即病毒當前的感染人數(shù)越多越容易進行新的傳播感染;3)病毒傳播的時效性,即隨著時間推移,病毒感染人群繼續(xù)感染他人的可能性會下降。例如,對于某個傳染病 d,其感染人群動態(tài)過程建模為一個速率為:
圖1:疾病感染人群動態(tài)過程的產(chǎn)生式概率圖模型
圖2:全球疫情趨勢天璣智能預測
如圖2所示,以6月17日數(shù)據(jù)為例,實際總確診數(shù)為83293,預測總確診數(shù)為83309,誤差率為0.02%,近乎真實反映了流行周期內(nèi)的疫情速度趨勢。BDA平臺將根據(jù)數(shù)據(jù)變化情況不斷調整算法、迭代優(yōu)化模型,為公眾提供更加智能與精準的預測結果供參考。
2 基于深度語義匹配的智能問答技術
“智能問答”功能基于深度語義匹配的信息檢索技術,面向大眾科普問答有關病毒傳播、實時情況、醫(yī)學信息、防護知識等。疫情期間,各類信息和人們的生活息息相關,如個人防護指南、確診治愈人數(shù)、工廠復工復產(chǎn)等指導信息。幫助用戶快速從大量疫情信息快速方便獲取需要的信息是Infobot的設計初衷。Infobot是信息驅動的對話機器人定制系統(tǒng)。通過該系統(tǒng)用戶可以快速根據(jù)自己的數(shù)據(jù)構建對話機器人。支持的用戶信息形式更為豐富:無結構文本、歷史問答、表格等,從而支持文本檢索、搜索問答、FAQ、表格問答等多種對話形式。
疫情期間,利用疫情數(shù)據(jù)和Infobot定制出NCP問答機器人小天,用來幫助人們快捷準確獲取回答疫情相關信息。從衛(wèi)健委采集疫情數(shù)據(jù)形成表格,基于表格問答技術,幫助用戶快速了解各地疫情情況。從權威網(wǎng)站采集大量問答對,涵蓋個人防護的各種細節(jié),幫助群眾做好個人防護。從權威新聞網(wǎng)站100多萬新聞數(shù)據(jù),進行全文索引查詢,并加入深度語義匹配,幫助用戶快速獲取疫情相關消息。
圖3:天璣疫情智能問答助手
“專家預測”功能收集整理各大權威專家與機構發(fā)布的疫情相關預測;“模擬預測”功能基于經(jīng)典傳染病傳播模型SEIR原理,通過網(wǎng)民自行調節(jié)“人員接觸”參數(shù),模擬可能的疫情結果,直觀感受隔離對疫情防控的影響,并可針對“感染增速何時下降?”提出自己的觀點。
圖4:模擬預測與專家預測觀點
3 基于天璣數(shù)據(jù)大腦的輿情感知監(jiān)測技術
“態(tài)勢分析”功能針對疫情期間的輿論話題進行分析,包括整體態(tài)勢、媒體態(tài)勢分析及網(wǎng)民態(tài)勢分析模塊,通過“天璣數(shù)據(jù)大腦”對海量網(wǎng)絡信息進行實時的自動信息采集、分析、匯總、監(jiān)測、并識別其中的關鍵信息,及時了解話題態(tài)勢和熱點關注。
圖5:態(tài)勢分析
“信息助理”功能針對網(wǎng)友關注的疫情防護與保障,推薦實用工具與資訊。其中“工具推薦”提供第三方疫情防控工具服務,如天璣疫情智能問答助手、新冠肺炎小區(qū)查詢、個人防護能力測試等;“熱點關注”展示最近一段時間內(nèi)網(wǎng)絡關注熱門話題,為政府及企業(yè)能夠及時掌握當前熱點話題風向提供支撐;“疫后保障”功能展示政府及社會各界出臺的各類利民、優(yōu)惠政策、企業(yè)復工保障等內(nèi)容;“個人貼士”功能展示個人防疫知識、健康習慣建議、自我心理調節(jié)、遠程辦公技能等內(nèi)容。
圖 6:信息助理
4 基于時空關聯(lián)的風險分析預警技術
天璣智能情報分析系統(tǒng)(GoIN)通過對覆蓋政治、軍事、經(jīng)濟、社會等方面的大數(shù)據(jù)關聯(lián)融合,輔助用戶從大數(shù)據(jù)中萃取重大情報,實現(xiàn)人機協(xié)同的情報深度可視化分析、快速研判、智能生成與協(xié)同決策。“智疫通”基于GoIN對全國疫情發(fā)展態(tài)勢、不同時空的演化對比、確診患者行為軌跡、治療藥物和研究單位進行時空關聯(lián)圖譜分析,綜合分析確診病患、疑似病患和密切接觸者的行動軌跡,準確刻畫跨地域漫入、漫出的不同類別人員的流動情況,追蹤高危聚集地和潛在受感染者,進行疫情傳播規(guī)律與風險感知預警,指導防控和復工復產(chǎn),加快產(chǎn)業(yè)經(jīng)濟復蘇。
首先,將各省市公布的患者行為軌跡數(shù)據(jù)拆分成省份、城市、患者、軌跡事件、活動地點五類節(jié)點進行處理。截止到2020年2月18日,共收集數(shù)據(jù)包含30個省份(湖北省未公布)、316個城市、4159例確診病例、17417條軌跡事件、4416個活動地點。該五類節(jié)點之間存在如下四類關系:1)患者與軌跡事件;2)患者與活動地點;3)活動地點與城市;4)城市與省份。
根據(jù)收集到的數(shù)據(jù),采用PageRank算法展開多維度分析。
一是進行節(jié)點重要度分析,以反映地區(qū)疫情的嚴重程度。在省份層面,黑龍江省、河南省、重慶市、湖南省這些省份排名靠前。以黑龍江省為例,如圖7所示,可以看到黑龍江省下屬的地級市的患者活動地點(藍色點)都較多,并且有四個地級市(哈爾濱市、雙鴨山市、牡丹江市、七臺河市)的患者都在“哈爾濱冰雪大世界”活動過。
圖7:黑龍江省各市的患者信息
在城市層面,黑龍江省哈爾濱市、湖南省常德市、河南省商丘市、湖南省株洲市排名比較靠前。在患者活動層面,珠海站、湖南省株洲市腰潞鎮(zhèn)橫屋村,黑龍江省雙鴨山市友誼縣寶盛超市、黑龍江省哈爾濱市九豐家園、惠東萬科雙月灣、廣州南站等地點排名靠前,這些地點確診病例患者活動較多,可能出現(xiàn)聚集性疫情。
圖8:腰潞鎮(zhèn)橫屋村患者信息
二是進行社區(qū)發(fā)現(xiàn)分析,聚類出“中山大學附屬第五醫(yī)院”、“友誼寶盛超市”和“苗姓、冉姓家庭”三大社區(qū),患者活動地點與節(jié)點重要度分析結果相印證,證明病毒的社區(qū)性和家庭性傳播是值得注意的。
圖9:友誼寶盛超市社區(qū)
“智疫通”同時對疫情變化進行時空分析?;?019年12月1日至2020年2月20日的全國疫情數(shù)據(jù)進行分析后發(fā)現(xiàn):1)從全國疫情變化層面,可看出疫情是由武漢向周邊城市逐漸擴散;2)從湖北疫情變化方面,武漢周圍城市疫情最嚴重的;3)將疫情嚴重的湖北與浙江疫情變化進行對比,發(fā)現(xiàn)兩個省的疫情模式完全不同。湖北主要從中心城市武漢向外發(fā)散,浙江主要從沿海城市溫州向內(nèi)發(fā)散。
圖10:全國確診疫情發(fā)展態(tài)勢
研究單位和藥物關聯(lián)也是重要的分析方向。在研究單位活躍度層面,較為活躍的有華中科技大學同濟醫(yī)學院(一共進行了15項臨床課題研究)和浙江大學醫(yī)學院附屬第一醫(yī)院(一個合作課題和8項獨立研究)。在研究單位間的合作層面,當前研究合作較密切的有湖北、天津、北京等地中醫(yī)院。在治療藥物及其手段方面,發(fā)現(xiàn)研究課題中最受關注的的藥物或手段主要有三類:氯喹類藥物(至少有15項課題圍繞該類藥物開展)、洛匹那韋/利托那韋片(圍繞其開展的課題研究至少8項)、中醫(yī)藥相關藥物的研究:包括金銀花,雙黃連口服液,連花清瘟顆粒等(圍繞其開展的研究至少有10項)。分析發(fā)現(xiàn)氯喹和金銀花是研究藥物的兩項重要成分。
圖11:研究單位合作
圖12:治療藥物及其手段
應用效果
目前,根據(jù)“智疫通”平臺發(fā)布的多期全球疫情趨勢智能預測日報,內(nèi)容涵蓋疫情快訊、趨勢預測、熱點關注、互動話題,服務于大眾。此外,推送多期疫情輿情分析報告和簡報給政府主管部門,并配合對疫情傳播過程中的線索做專項分析,為政府提供疫情防控決策參考。
“智疫通”與中再集團合作,推出“再·醫(yī)”平臺疫情預測研究與輿情態(tài)勢分析功能,“再·醫(yī)”平臺依托國家衛(wèi)健委、國資委、國家疾控中心、國家氣象局、中國人壽、丁香醫(yī)生及多家國內(nèi)科技企業(yè),充分發(fā)揮政企協(xié)同優(yōu)勢,匯聚疫情防控、疫情預警、疫情地圖、實時播報、辟謠與防護、在線就醫(yī)診療等方面的數(shù)據(jù)和專業(yè)服務能力。其中,“共抗疫情”頻道開辟“風險自評、疫情動態(tài)、疫情預測”欄目,幫助海外國人提升疫情風險防控意識,增加風險抵御技能,提供更全面的智能化疫情防控服務,共同守護“一帶一路”沿線國家國人的健康。
在“停課不停學”背景下,山東財經(jīng)大學應用“智疫通”將疫情大數(shù)據(jù)建模與預測融入遠程實踐教學,組織近百名師生進行線上模擬預測與分析實戰(zhàn),產(chǎn)生良好的示范作用,促進校企融合“復學復課”,為進一步建立長效合作機制,服務社會提供了契機。
將來,“智疫通”還將根據(jù)疫情演變情況,進一步研發(fā)拓展其功能,為公眾提供更全面的風險感知預警服務,數(shù)據(jù)不僅覆蓋國家衛(wèi)健委、各地衛(wèi)健委、權威媒體官網(wǎng)的公開信息,更依托“天璣數(shù)據(jù)大腦”,不斷學習矯正,確保數(shù)據(jù)信息安全可靠、實時全面。
關于中科天璣
中科天璣數(shù)據(jù)科技股份有限公司成立于2010年1月,是中國科學院計算技術研究所(簡稱“中科院計算所”)控股的大數(shù)據(jù)方向高新技術企業(yè),是中科院計算所加速大數(shù)據(jù)技術成果轉化,在大數(shù)據(jù)方向唯一的產(chǎn)業(yè)化平臺。公司以大數(shù)據(jù)智能計算引擎、人工智能算法為核心,圍繞大數(shù)據(jù)平臺、自然語言處理、機器學習、知識圖譜、人工智能等方面不斷拓展。
中科天璣是大數(shù)據(jù)分析系統(tǒng)國家工程實驗室的重要共建單位和示范應用基地,承建的大數(shù)據(jù)引擎及情報分析系統(tǒng)實驗室致力于推進大數(shù)據(jù)基礎設施、大數(shù)據(jù)分析和情報大數(shù)據(jù)示范應用三大方向技術研究和大數(shù)據(jù)產(chǎn)品的定型推廣。
中科天璣技術力量雄厚,專業(yè)人才濟濟,博士、碩士人數(shù)占總人數(shù)的35%以上,核心成員承擔過國家863計劃、國家973計劃、國家自然科學基金及國家信息安全重大專項等多項重大課題的研究,并多次榮獲國家重大獎項。
中科天璣始終踐行“深挖價值、服務國家、惠及大眾”的愿景,致力于打造安全可信、智慧敏捷的大數(shù)據(jù)基礎平臺產(chǎn)品和行業(yè)大數(shù)據(jù)應用系統(tǒng),建設情報大數(shù)據(jù)分析第一品牌,為用戶提供大數(shù)據(jù)整體解決方案,助力中國大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新發(fā)展。
來源: 數(shù)據(jù)猿
刷新相關文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14