64個博士“眾籌”基因大數(shù)據(jù)分析,識基因?qū)ぁ鞍臂?
吳寧川 | 2016-02-25 16:13
【數(shù)據(jù)猿導(dǎo)讀】 基因測試成本在過去的十年大幅下降,但基因大數(shù)據(jù)的分析卻遲遲跟不上步伐。美國64位華人醫(yī)學(xué)博士要用眾籌方式建立中國人自己的基因數(shù)據(jù)庫和大數(shù)據(jù)分析平臺

基因測序是國際公認(rèn)的基因檢測標(biāo)準(zhǔn)。作為精準(zhǔn)醫(yī)療的重要手段,基因測序能鎖定個人病變基因。
在10年前,基因測序成本約為幾十億美金;5年前喬布斯患上胰腺癌之時,做全基因測序的費用已經(jīng)降到了十萬美金;到2015年,全基因測序成本進一步降到了1000美金。
雖然基因測序成本的下降速度非??欤珜驍?shù)據(jù)的分析還沒有跟上。
每個人都有23000多個基因,相應(yīng)的全基因測序數(shù)據(jù)結(jié)果可達(dá)幾百GB到1TB之間。如何在基因突變與已知疾病之間建立關(guān)系,需要基因大數(shù)據(jù)與疾病大數(shù)據(jù)之間的相關(guān)性分析。這難在一方面需要大數(shù)據(jù)分析能力,另一方面還需要跨學(xué)科知識指導(dǎo)。
數(shù)據(jù)分析需要一個數(shù)學(xué)模型作為初始起點,再用大數(shù)據(jù)對這個數(shù)學(xué)模型不斷進行優(yōu)化。對于數(shù)據(jù)分析來說,有三個通用數(shù)學(xué)模型:統(tǒng)計模型、神經(jīng)網(wǎng)絡(luò)和專家知識系統(tǒng)。其中前二者偏向純數(shù)學(xué)方式且需要海量計算,而專家知識系統(tǒng)則結(jié)合了行業(yè)專業(yè)知識,在提高分析效率的同時減少了計算量。
十年前,還在讀碩士的余偉師就已經(jīng)開始研究基因與疾病、基因與癌癥的關(guān)系。他于2005至2010年先后在國際知名雜志上發(fā)表了7篇基因表達(dá)與健康及疾病相關(guān)的論文。2010年底,余偉師從華東師大生物醫(yī)學(xué)專業(yè)博士畢業(yè)后,進入美國國立衛(wèi)生研究院NIH從事博士后研究。
余偉師在一直在思考如何將自己研究了10多年的基因知識貢獻給國內(nèi)的醫(yī)療健康事業(yè)。當(dāng)時美國的基因數(shù)據(jù)分析正蓬勃發(fā)展,而中國在這方面還很不成熟——成本高、時效低、缺乏中國人自己的基因數(shù)據(jù)庫。而針對疾病尤其是癌癥的復(fù)雜性,還必須與更多交叉學(xué)科的專家,一起解決臨床遇到的問題。
余偉師從這個思路出發(fā)逐漸聚集了64位華人博士,當(dāng)中不乏頂尖機構(gòu)的教授。64位華人博士湊在一起做什么呢?簡單說,就是在自己的工作之余,把醫(yī)學(xué)相關(guān)文獻里關(guān)于某基因突變與某疾?。ㄒ阅[瘤為主)之間的潛在關(guān)系收集起來,形成一個專家知識庫。然后再把這種潛在對應(yīng)關(guān)系,與美國現(xiàn)有臨床結(jié)果作印證,構(gòu)建成專業(yè)的數(shù)據(jù)庫。
經(jīng)過兩年多的努力,這個團隊已經(jīng)把公共數(shù)據(jù)里關(guān)鍵的疾病信息都搜集出來并進行了驗證。該數(shù)據(jù)庫已經(jīng)找出了11000多個與腫瘤疾病相關(guān)聯(lián)的基因和相對應(yīng)的位點,也就是說已經(jīng)整合了人體一半以上的基因,其它的還處于未知階段。
64 位博士之所以通過類「眾籌」的方式建立這個專家知識數(shù)據(jù)庫,最初的動力是在閱讀和摘錄醫(yī)學(xué)文獻的時候需要專業(yè)的辨別能力。即使是某個醫(yī)學(xué)專業(yè)的博士,如果水平不夠或是在某個疾病領(lǐng)域研究不夠透,都無法辨別文獻中結(jié)論的準(zhǔn)確性。而這64個博士在不同醫(yī)學(xué)和疾病領(lǐng)域各有專長,因此具備專業(yè)篩查能力。
當(dāng)余偉師的團隊帶著自己的科研成果回國交流時,立刻就受到了國內(nèi)醫(yī)療機構(gòu)和第三方檢驗所的注意,團隊所掌握的技術(shù)在合作單位進行了充分試驗,并得到積極的反饋。于是,余偉師放棄了即將申請下來的2016年150萬美元的NIH個人研究經(jīng)費以及晉升NIH研究員的機會,還放棄了申請中的美國綠卡,回國創(chuàng)業(yè)成立了賽?;蚬?。
賽?;蛴兄鴱姶蟮膶<谊犖椋浼夹g(shù)總監(jiān)為耶魯大學(xué)應(yīng)用數(shù)學(xué)博士,在美國俄亥俄州立大學(xué)長年從事生物信息學(xué)分析,擁有深厚的數(shù)學(xué)功底、豐富的生物信息分析經(jīng)驗。賽?;虻氖袌隹偙O(jiān)為美國俄亥俄州立大學(xué)博士,在美國從事了近二十年的膀胱癌研究。2016年還將有20余位醫(yī)學(xué)博士回國加入賽?;?,同時也將與美國各大醫(yī)學(xué)科研機構(gòu)形成深度合作,通過眾籌合作共同推進精準(zhǔn)醫(yī)療技術(shù)發(fā)展。
賽福基因結(jié)合云計算技術(shù),以基于智能機器學(xué)習(xí)的方式,自動化地為醫(yī)院健康類B端客戶提供基因大數(shù)據(jù)分析。賽?;蚰壳爸饕c國內(nèi)三甲醫(yī)院以及癌癥領(lǐng)域頂尖醫(yī)院合作,這些醫(yī)院集合了國內(nèi)比較權(quán)威的樣本庫,與賽?;虻幕A(chǔ)數(shù)據(jù)庫結(jié)合起來后,對建立中國人自己的疾病基因數(shù)據(jù)庫將起重要作用。
來源:鈦媒體
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重