#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程序平臺(tái)丨數(shù)據(jù)猿新冠戰(zhàn)“疫”公益策劃
原創(chuàng) 全天智能 | 2020-07-09 12:48
【數(shù)據(jù)猿導(dǎo)讀】 大數(shù)據(jù)作為信息科技的基礎(chǔ),具有體量巨大、數(shù)據(jù)種類(lèi)多樣、處理速度快和價(jià)值密度低等鮮明特點(diǎn),在疫情追蹤、溯源與預(yù)警、輔助醫(yī)療救治、助力資源合理配置及輔助決策中得到廣泛應(yīng)用,全面配合“智慧戰(zhàn)疫”。

“該項(xiàng)目案例由全天智能提交申報(bào),參與數(shù)據(jù)猿推出的《尋找新冠戰(zhàn)“疫”,中國(guó)數(shù)據(jù)智能產(chǎn)業(yè)先鋒力量》的公益主題策劃活動(dòng)。
2019 年底到 2020 年初,新冠肺炎疫情在湖北武漢暴發(fā),并迅速向全國(guó)蔓延。疫情來(lái)勢(shì)洶洶,黨中央、各級(jí)政府和全國(guó)軍民共克時(shí)艱,到三月底,這場(chǎng)傾舉國(guó)之力的疫情防控戰(zhàn)“役”終于初見(jiàn)成效。而在這個(gè)過(guò)程中,大數(shù)據(jù)、云計(jì)算、人工智能等快速發(fā)展的新一代信息通信技術(shù),與疫情期間國(guó)家治理的方方面面深度融合,成為科技戰(zhàn)“疫”的先鋒。
大數(shù)據(jù)作為信息科技的基礎(chǔ),具有體量巨大、數(shù)據(jù)種類(lèi)多樣、處理速度快和價(jià)值密度低等鮮明特點(diǎn),在疫情追蹤、溯源與預(yù)警、輔助醫(yī)療救治、助力資源合理配置及輔助決策中得到廣泛應(yīng)用,全面配合“智慧戰(zhàn)疫”。
項(xiàng)目起止時(shí)間:2020年2月1日至今
應(yīng)用場(chǎng)景
應(yīng)用場(chǎng)景一:追蹤疫情最新進(jìn)展
在疫情面前,追蹤疫情最新進(jìn)展是主動(dòng)對(duì)抗疫情的有效手段之一。
大數(shù)據(jù)技術(shù)除了可以提供研判預(yù)警之外,在篩查、追蹤傳染源、阻斷疫情傳播路徑等方面,發(fā)揮了積極地作用。利用實(shí)名制售票的大數(shù)據(jù)優(yōu)勢(shì),及時(shí)配合地方政府及各級(jí)防控機(jī)構(gòu)提供確診病人車(chē)上密切接觸者信息。如果出現(xiàn)確診或疑似旅客,會(huì)調(diào)取旅客相關(guān)信息,包括車(chē)次、車(chē)廂等,然后提供給相關(guān)防疫部門(mén)進(jìn)行后續(xù)處理。
此外,利用大數(shù)據(jù)分析還可以看到人群遷徙圖,具體到哪些城市。我們可以通過(guò)大數(shù)據(jù)應(yīng)用平臺(tái),時(shí)刻掌握各個(gè)省市的入省人數(shù)、疫區(qū)人數(shù)和體溫異常情況等統(tǒng)計(jì)分析數(shù)據(jù)。
應(yīng)用場(chǎng)景二:共享公共信息平臺(tái)
在重大疫情面前,對(duì)民眾釋放多種信息,并對(duì)這些給出提前的壓力過(guò)程進(jìn)行數(shù)據(jù)監(jiān)控、并進(jìn)行壓力釋放、預(yù)防是非常重要的。
以疫情地圖、疫情趨勢(shì)、國(guó)內(nèi)國(guó)外疫情等形式,實(shí)時(shí)播報(bào)肺炎疫情動(dòng)態(tài),只要點(diǎn)擊系統(tǒng)界面地圖中的每個(gè)省份,就可以顯示各省確診、疑似、死亡的新增及累計(jì)數(shù)據(jù)詳情,甚至能精確到每個(gè)小區(qū)。
這樣不僅為疫情防控阻擊戰(zhàn)提供了數(shù)據(jù)支撐,也充分保障了海內(nèi)外公眾知情權(quán),對(duì)于增強(qiáng)科學(xué)防控知識(shí)、提高科學(xué)防控意識(shí)具有積極作用。
面臨挑戰(zhàn)
良好和豐富的數(shù)據(jù)是開(kāi)展疫情防控應(yīng)用的基礎(chǔ)。傳統(tǒng)衛(wèi)生數(shù)據(jù)的采集起點(diǎn)通常是基層的社區(qū)衛(wèi)生中心,通過(guò)社區(qū)人員手工填報(bào),經(jīng)歷區(qū)衛(wèi)健委、市衛(wèi)健委,最終匯集至省衛(wèi)健委和國(guó)家衛(wèi)健委。難以在數(shù)據(jù)源頭快速核驗(yàn)數(shù)據(jù)的正確性,增加了后期數(shù)據(jù)質(zhì)量管理的成本。
為保障數(shù)據(jù)采集的全面和準(zhǔn)確性,應(yīng)同步采用自動(dòng)化采集工具和數(shù)據(jù)質(zhì)量核驗(yàn)等手段,對(duì)于多源頭數(shù)據(jù)應(yīng)明確主要來(lái)源,從對(duì)應(yīng)系統(tǒng)或平臺(tái)中抓取,減少自報(bào)數(shù)據(jù)和重復(fù)采集。
但是,數(shù)據(jù)互通仍面臨諸多障礙,如尚未建立有效的數(shù)據(jù)互通機(jī)制,無(wú)法在較短的時(shí)間內(nèi)明確數(shù)據(jù)互通的需求和范圍,相關(guān)技術(shù)由于存在接口和規(guī)則壁壘,也難以支撐大數(shù)據(jù)量的快速聯(lián)通。從疫情分析的數(shù)據(jù)來(lái)看,目前公開(kāi)渠道獲取的數(shù)據(jù)不規(guī)范,數(shù)據(jù)口徑、數(shù)據(jù)統(tǒng)計(jì)時(shí)間等維度不統(tǒng)一,為分析帶來(lái)很大困難。數(shù)據(jù)源混雜重復(fù)、數(shù)據(jù)質(zhì)量不高的情況。
實(shí)施過(guò)程
我們對(duì)平臺(tái)的疫情大數(shù)據(jù)服務(wù)進(jìn)行了梳理,平臺(tái)上提供的基礎(chǔ)功能包括:
1.疫情數(shù)據(jù):顯示累計(jì)和每日新增的確診/疑似/死亡/治愈病例數(shù)的全國(guó)及分省、市數(shù)據(jù),并通過(guò)疫情地圖以及各種形式的圖表進(jìn)行展示;
2.最新進(jìn)展:聚合最新的重要疫情信息,且多為官方發(fā)布的、不容錯(cuò)過(guò)的重要內(nèi)容;
3.同程查詢:可根據(jù)出行日期,車(chē)次/車(chē)牌/航班號(hào)及城市等,查詢出已確診病例的具體行程信息,以方便個(gè)人防控;
4.本地疫情:根據(jù)用戶所在城市,顯示本地的確診信息及本地相關(guān)的疫情內(nèi)容。
首先,平臺(tái)上的疫情核心數(shù)據(jù),幾乎都是從國(guó)家及各地衛(wèi)健委官網(wǎng)上,通過(guò)爬蟲(chóng)技術(shù)基于其每日發(fā)布的疫情通報(bào)文章提取出來(lái)的。之后,再對(duì)這些數(shù)據(jù)進(jìn)行匯總以及通過(guò)地圖、走勢(shì)圖等可視化的圖表形式展示出來(lái),方便大家查閱。
例如在衛(wèi)健委官方網(wǎng)站上,是以文字信息的形式發(fā)布的疫情核心數(shù)據(jù):而到了平臺(tái)上,數(shù)字還是那些數(shù)字,但展現(xiàn)形式則變得更形象了,如下圖:
至于其它各類(lèi)信息的來(lái)源,也幾乎都是一些官方渠道提供的文字信息或可公開(kāi)查詢的信息,數(shù)據(jù)來(lái)源會(huì)更加豐富,除了衛(wèi)健委的官方網(wǎng)站,可能還包括其它政府部門(mén)、醫(yī)療機(jī)構(gòu)、學(xué)術(shù)機(jī)構(gòu)、權(quán)威媒體甚至意見(jiàn)領(lǐng)袖的網(wǎng)站或自媒體等。這些新媒體平臺(tái)獲取到這些信息以后,再進(jìn)行加工處理,從而形成了其它的一些欄目,如最新進(jìn)展、同程查詢、發(fā)熱門(mén)診等等。
例如在衛(wèi)計(jì)委官網(wǎng)上發(fā)布了文字形式的確診病例的行動(dòng)軌跡,而在平臺(tái)上,經(jīng)過(guò)整理,則變成了相同行程查詢小工具,如下圖:
至于平臺(tái)數(shù)據(jù)略有差異,則是因?yàn)槠脚_(tái)進(jìn)行不同數(shù)據(jù)的抓取和加工的策略有所不同。例如,只抓取截止到前一日24點(diǎn)的全國(guó)數(shù)據(jù),一天更新一次;而有的數(shù)據(jù),則會(huì)不定時(shí)地抓取一些各省最新發(fā)布的數(shù)據(jù),并隨時(shí)將其補(bǔ)充進(jìn)去。
通常來(lái)說(shuō),進(jìn)行數(shù)據(jù)抓取需要如下三步:
第一步:確定數(shù)據(jù)源規(guī)則
例如前面的那些衛(wèi)健委網(wǎng)站,其所發(fā)布的信息內(nèi)容的網(wǎng)址就是數(shù)據(jù)源。這些網(wǎng)址的名稱通常都是有一些規(guī)律的,例如包含日期數(shù)字等。而通過(guò)數(shù)據(jù)抓取工具,可以定期、定時(shí)、自動(dòng)、批量地檢索所有可能的網(wǎng)頁(yè),并從中提取出有與采集規(guī)則相匹配的數(shù)據(jù)。當(dāng)然,除了抓取源頭的數(shù)據(jù),也可以去抓一些新媒體平臺(tái)經(jīng)過(guò)加工的二手?jǐn)?shù)據(jù),因?yàn)檫@些二手?jǐn)?shù)據(jù)已經(jīng)是經(jīng)過(guò)處理的了,數(shù)據(jù)的格式可能更為整齊并便于抓取。
第二步:確定數(shù)據(jù)采集規(guī)則
由于抓取的數(shù)據(jù)需要存儲(chǔ)到數(shù)據(jù)庫(kù)中,而數(shù)據(jù)庫(kù)通常都是需要提前確定數(shù)據(jù)格式的。因此,需要按照預(yù)先設(shè)計(jì)的數(shù)據(jù)格式,建立數(shù)據(jù)采集規(guī)則和數(shù)據(jù)模板,并在抓取數(shù)據(jù)的過(guò)程中,按照規(guī)則進(jìn)行數(shù)據(jù)的提取,這樣才能進(jìn)行后面的數(shù)據(jù)保存。例如數(shù)據(jù)源中的文字內(nèi)容是“xx年xx月xx日,xx省新增確診病例xxxx例”,那么在數(shù)據(jù)采集規(guī)則中,就需要包含日期字段、省份字段、新增確診病例字段,并在抓取的時(shí)候?qū)Ω鱾€(gè)字段進(jìn)行內(nèi)容填充。例如在“,”后和“省”之間的文字就是省份名稱,可以填充到這條信息的省份字段中,以此類(lèi)推(如果覺(jué)得不準(zhǔn)確,也可以設(shè)定將“日,”和“省新”之間的文字抓取為省份名稱,等等)。不過(guò),想配置出準(zhǔn)確完善的采集規(guī)則,可能需要了解一點(diǎn)最基本的HTML語(yǔ)言,以便通過(guò)網(wǎng)頁(yè)分析,準(zhǔn)確提取出所需要的信息。
第三步:保存到數(shù)據(jù)庫(kù)
前兩步完成以后,只要網(wǎng)絡(luò)正常,數(shù)據(jù)庫(kù)正確進(jìn)行了創(chuàng)建和配置,那么就可以很容易地將采集到的數(shù)據(jù)保存到數(shù)據(jù)庫(kù)中,并加以利用。
應(yīng)用效果
1.支持地方政府疫情防控
借助于移動(dòng)互聯(lián)網(wǎng)和智能手機(jī),人們可以隨時(shí)隨地獲取最新疫情動(dòng)態(tài)、科學(xué)防疫知識(shí)等各種數(shù)據(jù)。平臺(tái)通過(guò)電子政務(wù)平臺(tái)、微博、公眾號(hào)等定時(shí)發(fā)布最新疫情動(dòng)態(tài),運(yùn)用大數(shù)據(jù)分析,結(jié)合算法模型對(duì)疫情的傳播速度、傳播趨勢(shì)等進(jìn)行預(yù)測(cè),可為各地進(jìn)行動(dòng)態(tài)監(jiān)測(cè)管理、統(tǒng)籌醫(yī)療物資儲(chǔ)備、保障民生物資供應(yīng)、制定交通管制政策等提供有效依據(jù)。例如,基于疫情高發(fā)地區(qū)人員在春運(yùn)期間的交通出行數(shù)據(jù)進(jìn)行疫情分析預(yù)警,能夠通過(guò)追蹤確診患者、疑似患 者和密切接觸者的軌跡位置進(jìn)行精準(zhǔn)防控。
2.迅速鎖定“涉疫”人員流動(dòng)軌跡
通過(guò)集成電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)公司、交通部門(mén)等單位的信息,數(shù)據(jù)平臺(tái)分析出人員流動(dòng)軌跡。具體來(lái)說(shuō),利用數(shù)據(jù)分析、數(shù)據(jù)挖掘等技術(shù),一方面可以通過(guò)手機(jī)信令等包含地理位置和時(shí)間戳信息的數(shù)據(jù)繪制病患的行動(dòng)軌跡;另一方面,根據(jù)病患確診日期前一段時(shí)間的行動(dòng)軌跡和同行時(shí)間較長(zhǎng)的伴隨人員,基于大數(shù)據(jù)分析可以推斷出病患密切接觸者。綜合分析確診病患、疑似病患和相關(guān)接觸者的行動(dòng)軌跡,可 以準(zhǔn)確刻畫(huà)跨地域漫入、漫出的不同類(lèi)別人員的流動(dòng)情況。
3.疫情發(fā)展態(tài)勢(shì)預(yù)測(cè)與溯源
基于疫情高危人群相關(guān)數(shù)據(jù),結(jié)合疫情新增確診、疑似、 死亡、治愈病例數(shù),借助傳播動(dòng)力學(xué)模型、動(dòng)態(tài)感染模型、 回歸模型等大數(shù)據(jù)分析模型和實(shí)踐技術(shù),不僅可以分析展示發(fā)病熱力分布和密切接觸者的風(fēng)險(xiǎn)熱力分布,還可以進(jìn)行疫情峰值拐點(diǎn)等大態(tài)勢(shì)研判。利用深度學(xué)習(xí)等新興人工智能技術(shù),聯(lián)合出行軌跡流動(dòng)信息、社交信息、消費(fèi)數(shù)據(jù)、暴露接觸史等大量數(shù)據(jù)進(jìn)行科學(xué)建模,可以根據(jù)病患確診順序和密切接觸人員等信息定位時(shí)空碰撞點(diǎn),進(jìn)而推算出疾病傳播路徑,為傳染病溯源分析提供理論依據(jù)。
關(guān)于全天智能
深圳前海全天智能資訊有限公司(簡(jiǎn)稱“全天智能”),作為大數(shù)據(jù)可視化應(yīng)用解決方案的開(kāi)拓者,一直致力于大數(shù)據(jù)可視化及數(shù)據(jù)交互管理領(lǐng)域的探索與創(chuàng)新。
全天智能團(tuán)隊(duì)以實(shí)時(shí)大數(shù)據(jù)可視化分析平臺(tái)為支撐,以行業(yè)解決方案為觸角,形成自我迭代,不斷創(chuàng)新的商業(yè)模型?,F(xiàn)有解決方案已應(yīng)用于智慧城市/能源/園區(qū)/交通/零售/文旅/教育/輿情/物流等多個(gè)領(lǐng)域,在國(guó)內(nèi)同市場(chǎng)中占據(jù)領(lǐng)先地位。通過(guò)提供數(shù)據(jù)整合、數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)協(xié)同等一站式服務(wù),幫助企業(yè)解決信息孤島,為決策提供價(jià)值指導(dǎo),為企業(yè)從用戶增長(zhǎng)到商業(yè)增長(zhǎng)提供助力。
憑借豐富的數(shù)據(jù)交互實(shí)踐經(jīng)驗(yàn),全天智能將持續(xù)為各行業(yè)用戶提供優(yōu)質(zhì)的大數(shù)據(jù)可視化服務(wù)體驗(yàn)。
來(lái)源: 數(shù)據(jù)猿
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1創(chuàng)新工場(chǎng)兩篇論文入選ACL 2020,將中文
-
22020可信云大會(huì)丨《云MSP發(fā)展白皮書(shū)》重
-
3#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
4#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
5#榜樣的力量#工業(yè)富聯(lián)富集云防疫 App
-
6#后疫情時(shí)代的新思考#疫情之后,我有5
-
7WIFIPIX:后疫情時(shí)代,私域流量讓家居零
-
8#榜樣的力量#思必馳疫情防控機(jī)器人丨數(shù)
-
9從車(chē)風(fēng)險(xiǎn)新元素解析之一:純電動(dòng)車(chē)
-
10CCPA與全球消費(fèi)者隱私保護(hù)對(duì)中國(guó)出海企業(yè)