專家解析:大數(shù)據(jù)研究對(duì)于癌癥治療的焦點(diǎn)問題
【數(shù)據(jù)猿導(dǎo)讀】 怎樣通過大數(shù)據(jù)的收集、分析與應(yīng)用來研究、預(yù)防與治療癌癥是一個(gè)格外引人注目的話題。其中,大數(shù)據(jù)對(duì)于癌癥研究具有不容忽視的積極作用,結(jié)合癌癥研究過程中巨大的樣本量,大數(shù)據(jù)分析可以發(fā)現(xiàn)在小樣本量實(shí)驗(yàn)中通常遭到忽視的細(xì)節(jié)問題

在今年一月,美國副總統(tǒng)拜登在瑞士達(dá)沃斯世界經(jīng)濟(jì)論壇的科學(xué)家小組討論中提出了一系列攻克癌癥的具體要求。其中,怎樣通過大數(shù)據(jù)的收集、分析與應(yīng)用來研究、預(yù)防與治療癌癥成為了一個(gè)格外引人注目的話題。
專家:
•Keith Perry:圣裘德兒童研究醫(yī)院高級(jí)副總裁和首席信息官
•Narayan Desai:圣何塞通信公司愛立信計(jì)算機(jī)科學(xué)家
•Nevann Krogan:加州大學(xué)舊金山分校細(xì)胞和分子藥理學(xué)教授
•Trey Ideker:Ph.D,UCSD計(jì)算生物學(xué)和生物信息中心創(chuàng)始人和UCSD醫(yī)學(xué)部醫(yī)學(xué)遺傳學(xué)主任
大數(shù)據(jù)的“大”意味著研究者所積累數(shù)據(jù)的巨大體量,以及這些數(shù)據(jù)的重要性與正確分析之后可能揭示的大量事實(shí)。不論哪種情況,大數(shù)據(jù)研究都能在實(shí)踐中通過對(duì)大量數(shù)據(jù)集的分析來確定數(shù)據(jù)的變化趨勢、找到數(shù)據(jù)間關(guān)聯(lián)并發(fā)現(xiàn)數(shù)據(jù)的運(yùn)作模式。
大數(shù)據(jù)對(duì)于癌癥研究具有不容忽視的積極作用,結(jié)合癌癥研究過程中巨大的樣本量,大數(shù)據(jù)分析可以發(fā)現(xiàn)在小樣本量實(shí)驗(yàn)中通常遭到忽視的細(xì)節(jié)問題。然而除了數(shù)據(jù)的巨大體量之外,幾位專家提出了大數(shù)據(jù)研究所具備的其他特點(diǎn)。
當(dāng)Keith Perry還在休斯頓安德森癌癥中心工作的時(shí)候,他便提出了大數(shù)據(jù)不僅僅在于大,大數(shù)據(jù)研究還應(yīng)該包含一下三個(gè)特征:數(shù)據(jù)類型的多樣性,數(shù)據(jù)產(chǎn)出的速度以及數(shù)據(jù)集成的程度。“目前,由于具體研究項(xiàng)目與研究部門的不同,我們絕大多數(shù)的數(shù)據(jù)都是相對(duì)孤立的。”Perry認(rèn)為相對(duì)孤立數(shù)據(jù)的集成將在極大程度上發(fā)揮這些數(shù)據(jù)的潛力。
Narayan Desai在2015年的一篇Nature文章中指出基因組學(xué)將不得不解決到底需要生產(chǎn)多少數(shù)據(jù)的基本問題。全球數(shù)據(jù)的收集與分析能力有限,有限的能力需要以最高的效率加以利用。正因?yàn)闇y序技術(shù)的普及,大量的基因組研究機(jī)構(gòu)如雨后春筍般以一種較為分散的方式興起,正因?yàn)檫@些研究機(jī)構(gòu)的分散性,上述問題變得更加難以解決。
隱蔽的缺陷
目前,一些科學(xué)家正致力于將分散的測序數(shù)據(jù)加以整合,創(chuàng)造性地利用已有數(shù)據(jù)對(duì)臨床治療進(jìn)行指導(dǎo)。
Nevann Krogan教授認(rèn)為與大部分遺傳學(xué)家所認(rèn)識(shí)到的情況相比,基因組學(xué)已經(jīng)在事實(shí)上使我們更加接近了癌癥治療的革命。
“測序人員說只要我們投入更多的錢到測序中我們就能得到更加清晰的答案。”Krogan說,“我們對(duì)此表示否定,我們已經(jīng)接近飽和的數(shù)據(jù)并不能給我們的研究帶來多大進(jìn)展。”
盡管測序數(shù)據(jù)猶如潮水般上漲,基因檢測在癌癥治療實(shí)踐過程的突破仍然進(jìn)展緩慢。這一現(xiàn)象存在的一大重要原因就是大量堆積的新數(shù)據(jù)僅僅能夠證明癌癥驚人的多樣性,甚至僅僅是一種單一的腫瘤就包含著上千種基因突變。這種情況下便更需要研究人員準(zhǔn)群分辨促使癌癥發(fā)生的突變與那些對(duì)癌癥的發(fā)生并沒多少影響的突變。
Krogan博士和他的同事們相信除了大量積累數(shù)據(jù)之外,研究人員需要對(duì)數(shù)據(jù)間既有的潛在聯(lián)系投入更多的關(guān)注。
與加州大學(xué)圣迭戈分校的研究人員一致,Krogan博士也于2015年3月在Molecular Cell上提出了癌細(xì)胞地圖倡議(The Cancer Cell Map Initiative,CCMI)。
CCMI致力于揭示癌癥基因間復(fù)雜相互關(guān)系的系統(tǒng)性證據(jù),闡明癌癥與常規(guī)疾病及其他健康狀況本質(zhì)上的差異并據(jù)此繪制癌細(xì)胞中正常和突變基因及蛋白間的“線路圖”。參與這一倡議的其他成員還包括舊金山的格萊斯頓研究所、加州大學(xué)舊金山、圣地亞哥分校臨床和轉(zhuǎn)化研究所以及賽默飛世爾科技公司。
樣本關(guān)聯(lián)性分析
CCMI結(jié)合了UCSD專家生物醫(yī)學(xué)大數(shù)據(jù)方面的杰出知識(shí)與UCSD細(xì)胞結(jié)構(gòu)與功能的領(lǐng)先研究方法。UCSD計(jì)算生物學(xué)和生物信息中心創(chuàng)始人和UCSD醫(yī)學(xué)部醫(yī)學(xué)遺傳學(xué)主任Trey Ideker博士說“我們已經(jīng)擁有的足夠的數(shù)據(jù),我們現(xiàn)在的項(xiàng)目瓶頸是如何解讀這些癌癥基因組數(shù)據(jù)。”
在2015年的UCSD基因組學(xué)節(jié)上,Trey Ideker,博士指出對(duì)癌癥基因組的大量測序已經(jīng)證實(shí)了超過2萬個(gè)癌癥相關(guān)基因,但是由于基因相互作用網(wǎng)絡(luò)相關(guān)知識(shí)的缺乏,這些癌癥基因組信息的有效分析便顯得十分困難。正如Ideker博士所說的“沒有任何兩個(gè)癌癥病人的腫瘤在基因水平有著完全相同的組成。”
Ideker博士及其同事認(rèn)為生物信息學(xué)將會(huì)幫助解決這一難題。
在2013年出版的Nature Methods上,Ideker博士及其同事指出癌癥基因組圖譜計(jì)劃(The Cancer Genome Atlas ,TCGA)與國際癌癥基因組協(xié)會(huì)(the International Cancer Genome Consortium ,ICGC)已經(jīng)開始了對(duì)數(shù)千個(gè)腫瘤樣本的基因組信息多層次系統(tǒng)性分析。具體包括mRNA與microRNA的表達(dá),DNA拷貝數(shù)與甲基化分析以及DNA測序。文章的作者們指出諸如TCGA 與ICGC的工作可能會(huì)對(duì)某些更有野心的工作起到促進(jìn)作用。
基因表達(dá)子網(wǎng)絡(luò)分析
為了滿足癌癥大數(shù)據(jù)研究對(duì)數(shù)據(jù)集成方法的需求,UCSD團(tuán)隊(duì)與其他學(xué)者已經(jīng)對(duì)已知的幾種通路數(shù)據(jù)庫與子網(wǎng)絡(luò)相關(guān)蛋白編碼基因進(jìn)行了表達(dá)水平的集成分析。與以往簡單羅列不同基因與蛋白的方式不同,這種方法揭示了不同基因與蛋白表達(dá)局部網(wǎng)絡(luò)的聚集運(yùn)作方式。
正如該項(xiàng)目的研究人員所說,這類子表達(dá)網(wǎng)絡(luò)分析工作可以鑒定各種臨床病人的基因表達(dá)差異?;虮磉_(dá)子網(wǎng)絡(luò)分析不同于常規(guī)的數(shù)據(jù)分析,具有解釋相關(guān)信號(hào)網(wǎng)絡(luò)內(nèi)基因表達(dá)差異的能力。除了上述特點(diǎn)之外,基因表達(dá)子網(wǎng)絡(luò)分析仍然需要大量的生物信息學(xué)、統(tǒng)計(jì)學(xué)和相關(guān)研究機(jī)構(gòu)的支持,通過這種方式已有數(shù)據(jù)的潛在價(jià)值能夠充分地體現(xiàn)。
預(yù)后影響
大量的實(shí)驗(yàn)證據(jù)表明基因表達(dá)網(wǎng)絡(luò)分析對(duì)于預(yù)后有著重要的影響,UCSD研究人員在慢性淋巴細(xì)胞白血病領(lǐng)域的研究證實(shí)了上述基因表達(dá)子網(wǎng)絡(luò)分析對(duì)于大量病人具有有效的預(yù)后能力,減少臨床醫(yī)師在慢性淋巴細(xì)胞白血病患者診斷過程中產(chǎn)生的分歧,有效提高疾病的診斷與治療水平。這種預(yù)測性的基因表達(dá)子網(wǎng)絡(luò)分析根據(jù)基因表達(dá)水平的不同產(chǎn)生一定的差異,直到治療之前顯示出一致性。
UCSD研究人員認(rèn)為他們的分析技術(shù)對(duì)于研究癌癥的演變與臨床慢性淋巴細(xì)胞白血病治療策略的開發(fā)具有十分重要的作用。利用生物信息學(xué)的相關(guān)技術(shù),研究人員能夠準(zhǔn)確地挖掘龐大數(shù)據(jù)具備的實(shí)際意義。
來源:轉(zhuǎn)化醫(yī)學(xué)網(wǎng)
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會(huì)2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
9#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會(huì)丨《云MSP發(fā)展白皮書》重