6個(gè)創(chuàng)造性案例告訴你如何玩轉(zhuǎn)醫(yī)學(xué)大數(shù)據(jù)
【數(shù)據(jù)猿導(dǎo)讀】 生物醫(yī)學(xué)已經(jīng)并且正在產(chǎn)生海量的數(shù)據(jù)。對這些數(shù)據(jù)的開源和利用將產(chǎn)生巨大價(jià)值。在首屆開放科學(xué)獎(jiǎng)中專家小組宣布了六個(gè)進(jìn)入決賽的名單,從模擬果蠅大腦、病毒傳播可視化、到創(chuàng)建罕見病基因庫,讓我們看看這些進(jìn)入決賽的隊(duì)伍是如何玩轉(zhuǎn)生物大數(shù)據(jù)的

關(guān)于開放科學(xué)獎(jiǎng)
生物醫(yī)學(xué)研究產(chǎn)生了海量數(shù)據(jù)。許多《IEEE綜覽》(IEEE Spectrum是電氣電子工程師學(xué)會發(fā)行一個(gè)雜志,是電氣電子工程師學(xué)會的旗艦級出版物,致力于探索前沿科技的發(fā)展實(shí)現(xiàn)與應(yīng)用——譯者注)所關(guān)注介紹的諸如傳感器、機(jī)器人及其它相關(guān)技術(shù)會產(chǎn)生出太字節(jié)(terabyte, 240字節(jié)——譯者注)至拍字節(jié)(petabyte,250字節(jié)——譯者注)的數(shù)據(jù),而這只是在世界范圍內(nèi)所存儲的健康信息容量中微不足道的部分。
如今,三家投資機(jī)構(gòu)正在努力刺激工具和平臺的開發(fā),來提高研究者獲取和使用這些數(shù)據(jù)的能力。在華盛頓特區(qū)舉行的第7屆醫(yī)療數(shù)據(jù)研討會上,(美國)國立衛(wèi)生研究院(National Institute ofHealth,簡稱NIH)、總部在英國的威康信托基金(Wellcome Trust)以及霍華德?休斯醫(yī)學(xué)研究所(Howard Hughes Medical Institute)宣布了首屆開放科學(xué)獎(jiǎng)(Open Science Prize)的6支決賽隊(duì)伍名單。
開發(fā)這些類型的工具的部分問題是沒人知道誰該為它們負(fù)責(zé)。(美國)國立衛(wèi)生研究院的數(shù)據(jù)科學(xué)副主任菲利普?伯恩(Philip Bourne)說:“數(shù)據(jù)的產(chǎn)生是全球性的,但是數(shù)據(jù)本質(zhì)上是由國家管理和資助的。
去年10月發(fā)布后,來自45個(gè)國家96支隊(duì)伍參加了這個(gè)比賽。昨天,專家小組宣布了六個(gè)進(jìn)入決賽的名單,他們將獲得8萬美元的資助,在接下來的六個(gè)月里繼續(xù)開發(fā)他們的原型。
好了,不多說了,讓我們看看這些進(jìn)入決賽的隊(duì)伍是如何玩轉(zhuǎn)生物大數(shù)據(jù)的:
MyGene2
罕見疾病并不是你所想象的那么罕見。如今,在美國有超過6千種已知罕見疾病發(fā)生在大約2千5百萬人的身上。但是,超過一半的家庭經(jīng)歷了基因檢測而無法確診為疑似的罕見疾病。一個(gè)名為MyGene2的網(wǎng)站給家庭和臨床醫(yī)生帶來一個(gè)分享關(guān)于罕見疾病的健康和基因信息的地方,以此來推動檢測和發(fā)現(xiàn)引發(fā)疾病的新的罕見情況和基因。
MyGene2頁面-根據(jù)基因或者家庭ID進(jìn)行搜索
每個(gè)(疑似)罕見疾病家庭信息庫都涵蓋了故事-健康信息-基因數(shù)據(jù)-聯(lián)系方式等資料。其中,故事部分介紹包括照片,患者基本情況,和一個(gè)有血有肉的真實(shí)故事。以96號家庭為例,作者生動地?cái)⑹隽俗约旱呐畠篈va患病及被確診的整個(gè)過程。
健康信息則包含了這個(gè)家庭成員包括“發(fā)熱”“出汗”“頭疼”等一系列病癥的信息。
基因數(shù)據(jù)部分則可以根據(jù)” Inheritance Model”和” Confidence in Pathogenicity”的不同維度生過濾生成報(bào)告,發(fā)現(xiàn)這個(gè)家庭的candidate gene。
Nextstrain
為了干預(yù)和阻止流行病的爆發(fā),科學(xué)家們需要盡快得到來自病原體的基因數(shù)據(jù)。Nextstrain項(xiàng)目從世界各地的研究團(tuán)體聚集了大量的基因數(shù)據(jù)近乎實(shí)時(shí)地進(jìn)行了病毒傳播的可視化。例如,可以查看一下他們關(guān)于目前寨卡病毒演變的圖片。
這一交互可視化作品記錄了從2014年11月到現(xiàn)在Zika病毒的時(shí)時(shí)變化情況??梢园凑?ldquo;地理位置”和“樣本時(shí)間”兩種維度進(jìn)行劃分。
OpenAQ
根據(jù)世界衛(wèi)生組織(World Health Organization)的說法,空氣污染是導(dǎo)致8分之1全球死亡病例的罪魁禍?zhǔn)?,然而空氣質(zhì)量數(shù)據(jù)一直被存儲在不起眼的網(wǎng)站上,難以訪問,同時(shí)格式也不一致。OpenAQ平臺原型將數(shù)據(jù)進(jìn)行了合并和標(biāo)準(zhǔn)化,成為公眾可得、實(shí)時(shí)的空氣質(zhì)量數(shù)據(jù)。它已經(jīng)收集和分享了來自13個(gè)國家500多個(gè)地點(diǎn)的970萬空氣質(zhì)量檢測數(shù)據(jù)。
你可以通過地圖查看全球各國的Pm2.5數(shù)值。
當(dāng)然也可以直接用代碼拿走你需要的城市和國家的API原始數(shù)據(jù)。
Brainbox
能從互聯(lián)網(wǎng)上得到的腦成像數(shù)據(jù)量是難以置信的。相對于其它類型的數(shù)據(jù),神經(jīng)成像數(shù)據(jù)需要更充足的人力,例如:策劃和編輯圖像。Brainbox是一個(gè)在線實(shí)驗(yàn)室,它被設(shè)計(jì)成方便研究人員訪問的腦成像數(shù)據(jù)庫(特別之處是無需下載),并啟用分布式協(xié)作讓每個(gè)人能分享努力。
NeuroArch
盡管在映射整個(gè)人類大腦上付出了巨大的努力,一個(gè)更短期的目標(biāo)是映射一個(gè)更小的大腦,比如果蠅的大腦,它有著超過70%的涉及人類腦部疾病的類似基因。果蠅大腦瞭望臺項(xiàng)目將開放一個(gè)名為NeuroArch的開放圖像數(shù)據(jù)庫平臺,這個(gè)平臺存儲和處理跟果蠅大腦有關(guān)的信息,包括位置、形狀、每個(gè)神經(jīng)元的連接。
在一個(gè)地方存放所有這些數(shù)據(jù),可能形成一個(gè)模擬的果蠅大腦,在通過遺傳或給藥進(jìn)行修改時(shí),可以看到發(fā)生的相關(guān)變化。
OpenTrialFDA
當(dāng)美國食物和藥品管理局(U.S Food and Drug Administration)批準(zhǔn)一種藥物時(shí),該機(jī)構(gòu)公開發(fā)布一系列關(guān)于該藥物的信息,通常包含先前未公開的臨床試驗(yàn)。盡管這些信息相當(dāng)有價(jià)值,但難以獲得、收集和搜索。OpenTrialFDA努力建立一個(gè)用戶友好的網(wǎng)站界面讓任何人能訪問相關(guān)信息,還提供應(yīng)用接口(API),允許第三方平臺接入和搜索數(shù)據(jù)。
來源:Spectrum
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯(cuò)過的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重