醫(yī)療世界的“黑科技”:基于電子病歷大數(shù)據(jù)的可視化病癥分析
楊旭 趙韡 | 2016-08-24 10:57
【數(shù)據(jù)猿導讀】 電子病歷大數(shù)據(jù)分析技術幫助醫(yī)生迅速了解隱藏在病歷數(shù)據(jù)中的病情信息和治療方案,通過有效的大數(shù)據(jù)可視化技術將病歷數(shù)據(jù)與病癥關系以圖形圖像形式清晰展示給醫(yī)生,方便醫(yī)生探索其中的醫(yī)學診斷規(guī)則和模式,從而輔助其進行疾病診斷,對現(xiàn)有的HIS進行改進和完善

1、電子病歷大數(shù)據(jù)可視化分析概述
傳統(tǒng)紙本病歷數(shù)據(jù)缺乏有系統(tǒng)的整理,更無法和其他病歷數(shù)據(jù)產生連動性,缺乏查詢的便利性。電子病歷則是利用電子設備保存、管理、傳輸和重現(xiàn)的數(shù)字化病人醫(yī)療記錄。如果將數(shù)十萬甚至數(shù)百萬的電子病歷數(shù)據(jù)匯集在一起,再運用大數(shù)據(jù)分析技術加以分析,將具有難以估計的價值。
電子病歷大數(shù)據(jù)分析技術幫助醫(yī)生迅速了解隱藏在病歷數(shù)據(jù)中的病情信息和治療方案,通過有效的大數(shù)據(jù)可視化技術將病歷數(shù)據(jù)與病癥關系以圖形圖像形式清晰展示給醫(yī)生,方便醫(yī)生探索其中的醫(yī)學診斷規(guī)則和模式,從而輔助其進行疾病診斷,對現(xiàn)有的HIS進行改進和完善。電子病歷大數(shù)據(jù)可視化分析對經驗較為欠缺的醫(yī)生格外重要,即使病患的病情超出醫(yī)生經驗范圍,仍可透過電子病歷的大數(shù)據(jù)分析結果,更有針對性地看診,和病患的溝通也更加方便快捷,大大節(jié)省醫(yī)生詢問時間。同時,通過電子病歷大數(shù)據(jù)可視化分析,不僅病患所有健康情況一目了然,醫(yī)院的咨詢服務工作也會更加輕松,尤其慢性病患者的用藥及照護,更需要透過大數(shù)據(jù)分析建立完整的關聯(lián)性,避免提供錯誤資訊或錯過需要注意的現(xiàn)象。
2、構建“疾病網絡圖”的電子病歷大數(shù)據(jù)結構化處理方法
在可視化分析之前,需要將龐大的電子病歷數(shù)據(jù)資源處理成結構化的可用數(shù)據(jù)。首先,將電子病歷中涉及到的主要病情分成16大類,分別為:血液病、循環(huán)系統(tǒng)疾病、消化系統(tǒng)疾病、泌尿生殖系統(tǒng)疾病、免疫系統(tǒng)疾病、感染性疾病、受傷或中毒類疾病、心理疾病、骨骼肌肉類疾病、神經系統(tǒng)疾病、孕期疾病、呼吸系統(tǒng)疾病、感覺器官類疾病、皮膚病、腫瘤以及其他未分類疾病。其次,在病歷中針對各大類疾病中的主要關鍵詞,分成各副類別的疾病。例如,在血液病中,抽取兩個關鍵詞缺鐵和貧血作為副類別疾病。再次,將電子病歷中涉及到的各種癥狀或詞匯提取出來,例如:頭暈、疲倦、胃灼熱、腸絞痛等。最后,利用這些提取出來的數(shù)據(jù),構成一個M*M矩陣的數(shù)組結構,方便后續(xù)進行的可視化分析。表1展示了提取的矩陣結構,所有疾病大類、副類、癥狀及詞匯都作為此方形矩陣的節(jié)點,存儲在數(shù)組nodes中。每個節(jié)點中包含兩個元素:節(jié)點名稱name和節(jié)點半徑R(根據(jù)病歷中的出現(xiàn)頻次確定)。節(jié)點與節(jié)點間的關系存儲在edges數(shù)組中,wij用來表示節(jié)點間的關聯(lián)程度。
表1 M*M矩陣結構
3、構建“疾病網絡圖”
用節(jié)點表示對象,用線(或邊)表示關系的節(jié)點-鏈接布局是最自然的可視化布局表達。它容易被用戶接受,幫助其快速建立事物間的聯(lián)系,顯示表達事物間的關系。節(jié)點-鏈接布局主要包括力引導布局和基于距離的多維尺度分析布局兩種。
本研究選擇力導向圖與D3.js技術結合,D3.js技術來自開源js框架,可以不連接互聯(lián)網使用,保證數(shù)據(jù)及信息安全。力導向圖是在二維或三維空間里配置節(jié)點,節(jié)點間用線連接,稱為連線。各連線的長度相近且盡可能不相交。節(jié)點和連線都被施加力的作用,以此為據(jù)來計算節(jié)點和連線間的運動軌跡。力引導布局易于理解、容易實現(xiàn),可用大多數(shù)網絡數(shù)據(jù)集,且實現(xiàn)的效果具有較好的對稱性和局部聚合性,因此比較美觀、交互性好,整個布局結果更容易被接受。
3.1 力導向圖布局 力導向圖的布局是將初始化的數(shù)據(jù)轉換成畫圖可用的標準化數(shù)據(jù)。電子病歷的數(shù)據(jù)被整理成格式化數(shù)據(jù):數(shù)組nodes和edges,這兩個數(shù)組構成初始數(shù)據(jù)。在利用D3.js作圖前,需要將其轉化成可用的標準化力導向圖布局數(shù)據(jù)。
3.2 力導向圖繪制 在完成力導向圖布局后,利用D3.js提供的標準接口,完成“疾病網絡圖”的繪制。
3.2.1 繪制節(jié)點 在繪制節(jié)點時,預先綁定nodes數(shù)組。繪圖時根據(jù)nodes數(shù)組中的節(jié)點個數(shù),動態(tài)添加力導向圖的節(jié)點數(shù)目。在繪制過程中,使用統(tǒng)一的CSS3樣式,賦予相同大類的節(jié)點同類別的顏色。圖上的每個節(jié)點半徑R,為nodes數(shù)組中的R元素對應的值。
3.2.2 繪制連線 在繪制連線時,同樣需要預先綁定布局后的數(shù)組edges。根據(jù)edges數(shù)組中的連線條數(shù),動態(tài)添加力導向圖的連線數(shù)目。利用統(tǒng)一的CSS3樣式,控制連線的展示效果。連線上的權重形成節(jié)點之間力的大小。
3.2.3 可交互設計 基于D3.js進行數(shù)據(jù)可視化分析優(yōu)勢在于能夠實現(xiàn)圖形的可交互式操作。為清晰展示“疾病網絡圖”中節(jié)點之間的關系,當鼠標點擊某個節(jié)點時,只顯示與當前節(jié)點相關的其他節(jié)點,以及連線上的權重關系。
4、討論
在“疾病網絡圖”分析前,醫(yī)學領域已開始對疾病之間存在關聯(lián)關系達成共識。但具體哪幾種疾病之間存在關聯(lián),關聯(lián)程度的強弱程度是多少,疾病之間是否存在隱性聯(lián)系等問題仍然沒有形成清晰的認識。“疾病網絡圖”通過對MIT環(huán)境學院收集的匿名電子病歷數(shù)據(jù)進行大數(shù)據(jù)結構化處理,構建了疾病間的力導向關系圖,對疾病間的關聯(lián)關系給出詳細的分析結果,為醫(yī)生了解疾病間的關聯(lián)關系提供新的方法。
圖1 疾病網絡圖全局
圖1展示了基于百萬份電子病歷的“疾病網絡圖”全局圖,在這幅全局圖中,16種不同顏色代表了16大類疾病。副類疾病和疾病關鍵詞分別用圖中的節(jié)點來表示,節(jié)點的半徑大小顯示了關鍵詞在電子病歷中出現(xiàn)的次數(shù)。全局圖中,節(jié)點間的連線是透明顯示的,允許交叉。
圖2 胃灼熱與相關癥狀關聯(lián)圖
在圖2中展示了胃灼熱與相關癥狀關聯(lián)圖。在此關聯(lián)圖中,與胃灼熱看似關系不大的膝關節(jié)疼,卻成為與其相關度最近的關鍵詞。這種分析結果超出了醫(yī)生的常識性認知,為全面了解疾病之間的關聯(lián)性提供了更加科學的理性判斷方法。
5、結語
通過構建“疾病網絡圖”分析了百萬份電子醫(yī)療大數(shù)據(jù)內各種病癥與關鍵詞出現(xiàn)頻次以及疾病之間隱藏的關聯(lián)關系,以力導向圖的方式呈現(xiàn)分析結果。這種大數(shù)據(jù)可視化技術分析電子病歷的方法幫助醫(yī)生分析和獲取隱藏在電子病歷中大數(shù)據(jù)的信息和規(guī)律,幫助醫(yī)生綜合分析和利用這些病歷數(shù)據(jù),為病患進行有效的診斷和治療,充分利用電子病歷大數(shù)據(jù)的巨大價值。
來源:中國數(shù)字醫(yī)學
刷新相關文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產業(yè)高2018-12-03
- 2018上海國際計算機網絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關于醫(yī)
-
2數(shù)據(jù)軟件產品和服務商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風險感知
-
7#榜樣的力量#內蒙古自治區(qū)互聯(lián)網醫(yī)療服
-
8#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構建工業(yè)互聯(lián)網新