大數(shù)據(jù)走進(jìn)醫(yī)學(xué),助力基因?qū)W探究乳腺癌
機(jī)器之心 | 2016-01-05 14:07
【數(shù)據(jù)猿導(dǎo)讀】 如今大數(shù)據(jù)無(wú)處不在,體現(xiàn)在小到衣食住行,大到科技制造,無(wú)不有它存在的痕跡。如今,大數(shù)據(jù)進(jìn)駐醫(yī)學(xué)領(lǐng)域,助力于基因?qū)W對(duì)于腫瘤方面的研究,真可謂大數(shù)據(jù)有大希望啊

Adrian Lee一生致力于研究乳腺癌,這意味著他可以同時(shí)面對(duì)著很多疑難雜癥?!笡](méi)有任何兩個(gè)乳腺癌是完全一樣的。癌癥遠(yuǎn)比我們想象的要復(fù)雜。」 Lee說(shuō)。Lee是賓夕法尼亞大學(xué)的藥理學(xué)家和化學(xué)生物學(xué)家。
Lee正在使用基因技術(shù)來(lái)全面了解乳腺癌,并且利用這些知識(shí)來(lái)指導(dǎo)對(duì)病人的治療決定?!脯F(xiàn)在我們可以從單個(gè)樣品中去分析多個(gè)變量,例如DNA的改變、RNA的改變和甲基化的改變。全基因組掃描可以幫助建立更好的系統(tǒng)生物學(xué),從而使得我們可以了解一個(gè)特定腫瘤究竟是什么地方出錯(cuò)了?!?/p>
目前的腫瘤測(cè)序并以往任何時(shí)候都要快,要便宜,且更容易。通過(guò)許多研究人員收集測(cè)序數(shù)據(jù),并且上傳到公共數(shù)據(jù)庫(kù),例如癌癥基因組圖譜(TCGA),我們將有機(jī)會(huì)來(lái)描述乳腺中產(chǎn)生的許多不同類(lèi)型的癌癥。「曾經(jīng)這個(gè)目標(biāo)的挑戰(zhàn)是產(chǎn)生數(shù)據(jù),而這些問(wèn)題現(xiàn)在已經(jīng)解決了?,F(xiàn)在的挑戰(zhàn)是數(shù)據(jù)處理和數(shù)據(jù)分析——解釋這些突變,并且和腫瘤專(zhuān)家溝通。」
匹茲堡大學(xué)的研究人員正在努力找出患有乳腺癌的病人的分子特征和宿主的臨床數(shù)據(jù)之間的聯(lián)系,這些臨床數(shù)據(jù)包括與人年齡、種族和體重等相關(guān)的統(tǒng)計(jì)信息。他們正在著手建立這些臨床相關(guān)性、治療的相互作用和結(jié)果的電子健康檔案?!高@就好像我們要從一個(gè)大草垛中去找出一個(gè)針頭一樣。同時(shí)我們也在努力將這根針和很多其他事情聯(lián)系起來(lái)。」 Lee說(shuō)。從病人的電子檔案中將所有的數(shù)據(jù)收集起來(lái),這需要龐大的基礎(chǔ)工程的支持。匹茲堡已經(jīng)積累了5千萬(wàn)億字節(jié),即500千兆字節(jié),這些數(shù)據(jù)需要400000臺(tái)新iPhone 6設(shè)備才能存儲(chǔ)。
將這些從實(shí)驗(yàn)室獲得的大量測(cè)序數(shù)據(jù)和正在和乳腺癌抗?fàn)幍膫€(gè)體聯(lián)系在一起需要無(wú)數(shù)時(shí)間和超強(qiáng)的的電腦計(jì)算能力的支持。大數(shù)據(jù)時(shí)代需要那些適應(yīng)嘈雜噪聲的研究人員,以及在創(chuàng)建靈活的計(jì)算機(jī)程序方面的老手。
從數(shù)據(jù)到知識(shí)
大數(shù)據(jù)研究人員采取一個(gè)大的數(shù)據(jù)集,然后從中尋找模式。這樣做是希望可以找到突變,然后與相應(yīng)的藥物治療相聯(lián)系。這是個(gè)體化醫(yī)療的精髓:從病人的腫瘤中篩選一組生物標(biāo)記物,然后選擇最佳治療方案來(lái)對(duì)抗癌癥。大數(shù)據(jù)的研究人員認(rèn)為,通過(guò)分析數(shù)千個(gè)腫瘤的數(shù)據(jù)可以獲得相應(yīng)模式,從而可提高篩查和診斷,進(jìn)一步有利于提出合理的治療方案。
Lee及其同事已經(jīng)表明,大數(shù)據(jù)科學(xué)可以引導(dǎo)我們重新思考乳腺癌。他們使用了兩種公共數(shù)據(jù)庫(kù)——癌癥基因組圖譜(TCGA)和國(guó)際乳腺癌聯(lián)盟的分子分類(lèi)學(xué)(METABRIC),這些數(shù)據(jù)庫(kù)包含了數(shù)千種乳腺癌腫瘤的基因、RNA轉(zhuǎn)錄子和蛋白質(zhì)信息——來(lái)分析年輕人和年老一些的婦女的乳腺腫瘤中分子特征的差異。年齡低于40歲的女人更容易具有更糟的疾?。核麄兏赡芫哂型砥诎┌Y、更差的預(yù)防診斷結(jié)果和更糟的存活幾率。
該團(tuán)隊(duì)也分析了45歲以下(即有可能絕經(jīng)前的女性)和55歲以上(有可能絕經(jīng)后的女性)的女性的腫瘤數(shù)據(jù)?!肝覀冏屑?xì)觀察了你可能觀察的任何數(shù)據(jù),包括基因的突變、核糖核酸的突變、腫瘤的基因表達(dá)、變型中的某些特定基因表達(dá)數(shù)量的不同和DNA甲基化水平。他們發(fā)現(xiàn)絕經(jīng)前的女性其情況很不一樣,尤其是基因的表達(dá)這一部分。」
當(dāng)研究人員發(fā)現(xiàn)越來(lái)越罕見(jiàn)的基因突變時(shí),這些問(wèn)題變得越來(lái)越嚴(yán)峻。Lee剛剛看完了2000中基因突變的電子表格,「其中之一是ER突變,但是我如何從其他中間篩選呢?這是一個(gè)非?;A(chǔ)的問(wèn)題?!顾傅氖且粋€(gè)突變的雌激素受體,也是乳腺癌中一個(gè)常見(jiàn)的突變。
一種思路是分析突變基因影響的細(xì)胞途徑,這意味著使用開(kāi)發(fā)的算法將所有收集到的分子信息整合,并分類(lèi)成共同成長(zhǎng)類(lèi)或細(xì)胞周期途徑類(lèi)。研究人員可以使用這些分類(lèi)的信息就影響途徑來(lái)描述這些腫瘤細(xì)胞,而不是單純地說(shuō)影響分子。加州大學(xué)圣克魯茲分校生物信息學(xué)家Josh Stuart開(kāi)發(fā)了一種可以集成各種基因數(shù)據(jù)集的計(jì)算方法,這些基因數(shù)據(jù)已經(jīng)知道細(xì)胞——信號(hào)傳導(dǎo)途徑?!肝覀冎勒<?xì)胞中的基因周期,現(xiàn)在我們要問(wèn),在腫瘤細(xì)胞中究竟是那部分出問(wèn)題了?令人驚訝的是,我們成功了?!?Stuart說(shuō)。
Lee的研究小組在其研究中使用了PARADIGM計(jì)算分析方法。事實(shí)證明,這種方法對(duì)于揭示絕經(jīng)前婦女雌激素受體的陽(yáng)性乳腺癌功不可沒(méi)。該方法表明,雖然單個(gè)分子會(huì)有異常變化,但是它們通常都會(huì)在一組特定的、傳遞信號(hào)給整合素的通路中發(fā)生——涉及腫瘤相關(guān)的血管形成的蛋白質(zhì)。
具有雌激素受體陽(yáng)性乳腺癌的絕經(jīng)前婦女的腫瘤中的整合素非常重要,者也表明這些分子可以是治療靶標(biāo)?!高@些分子中有整聯(lián)蛋白抑制劑?!?Lee說(shuō)。并且有些分子已經(jīng)經(jīng)過(guò)臨床測(cè)試。
從知識(shí)到應(yīng)用
隨著大數(shù)據(jù)研究人員通過(guò)大量的腫瘤數(shù)據(jù)庫(kù)尋找突變模式時(shí),他們也會(huì)在其中增加新的類(lèi)別的乳腺癌。2012年,兩大數(shù)據(jù)庫(kù)公布了自己的關(guān)于數(shù)據(jù)驅(qū)動(dòng)的方法研究乳腺癌基因的論文。TCGA網(wǎng)絡(luò),這個(gè)由數(shù)十個(gè)美國(guó)和歐洲的科研機(jī)構(gòu)聯(lián)合起來(lái)的團(tuán)體,基于基因異常和表觀遺傳異常想出了乳腺腫瘤的四項(xiàng)總體分組基。他們發(fā)現(xiàn)只有不到10%的樣品中有三種基因發(fā)生了變異,表明稀有突變是乳腺癌類(lèi)型的一個(gè)重要部分。METABRIC,一個(gè)英國(guó)和加拿大的機(jī)構(gòu)聯(lián)盟,將基因數(shù)據(jù)(基因表達(dá)的數(shù)目和基因表達(dá)變異)與長(zhǎng)期的臨床結(jié)果相結(jié)合,將腫瘤分為十個(gè)大類(lèi)。通過(guò)與臨床數(shù)據(jù)相結(jié)合,這種新的分組可能使腫瘤學(xué)家做出更好的患者預(yù)防和治療決策。
「我們?nèi)匀辉谕晟莆覀兊难芯糠椒??!箘蜓芯吭河?guó)癌癥研究中心生物統(tǒng)計(jì)學(xué)家Oscar Rueda說(shuō),該機(jī)構(gòu)同時(shí)也是METABRIC研究機(jī)構(gòu)聯(lián)盟的一部分。他們正在對(duì)研究中的2000個(gè)樣品進(jìn)行測(cè)序。Rueda說(shuō),該研究希望發(fā)現(xiàn)基因突變的誘因,這是癌癥早期非常重要的一部分?!戈P(guān)于細(xì)胞如何變成癌細(xì)胞的理論就有數(shù)百種?!?/p>
大數(shù)據(jù)方法也許最終會(huì)發(fā)現(xiàn)一些之前被忽略的細(xì)胞途徑。西奈山伊坎醫(yī)學(xué)院的Avi Ma’ayan正致力于細(xì)胞途徑的數(shù)據(jù)庫(kù)的建設(shè),希望可以為將來(lái)的研究目標(biāo)提供一種資源。他的研究得益于美國(guó)國(guó)家研究院基于集成網(wǎng)絡(luò)細(xì)胞特征的衛(wèi)生圖書(shū)館(LINCS)的鼎力支持。LINCS可以使用研究院(例如麻省理工學(xué)院Broad研究所)產(chǎn)生的數(shù)據(jù)。Broad研究院的高產(chǎn)量實(shí)驗(yàn)室在十個(gè)不同的細(xì)胞系中測(cè)試一系列的藥物,從而研究藥物和細(xì)胞活動(dòng)之間的相互作用。這些藥物包括實(shí)驗(yàn)樣品以及經(jīng)過(guò)監(jiān)管機(jī)構(gòu)批準(zhǔn)的藥物。
「你會(huì)獲得細(xì)胞的行為特征,這些特征有助于新型藥物的研究?!?Ma’ayan說(shuō)。如果臨床研究人員想要關(guān)閉一個(gè)特定細(xì)胞轉(zhuǎn)換成癌癥的路徑,他們可以使用Ma’ayan的數(shù)據(jù)庫(kù)來(lái)搜索具有這個(gè)功能的藥物。
臨床應(yīng)用
接下來(lái)就是將這些關(guān)于可操作的突變的知識(shí)運(yùn)用到病人護(hù)理方面。研究醫(yī)院會(huì)收集關(guān)于病人護(hù)理的數(shù)據(jù),從而進(jìn)一步增加知識(shí)儲(chǔ)備。例如,在MD安德森癌癥中心,新的癌癥患者會(huì)對(duì)照已知癌癥基因做檢測(cè)?!高@不是對(duì)整個(gè)基因組,而是一組可操作的突變的200個(gè)基因。隨著研究知識(shí)的增加,這樣的小組也會(huì)增加。去年原始的200個(gè)基因已經(jīng)擴(kuò)展到了300個(gè)?!?Navin說(shuō)。
Navin的專(zhuān)業(yè)是單細(xì)胞測(cè)序,他可以研究血液中的腫瘤細(xì)胞。在一個(gè)樣品中只能收集10到20個(gè)細(xì)胞?!钢暗难芯糠椒▽?duì)于這樣小數(shù)量的細(xì)胞并不管用?!?單細(xì)胞測(cè)試方法使得病人可以通過(guò)用非侵入性測(cè)試(例如測(cè)試血液樣品)的方法來(lái)監(jiān)測(cè)治療過(guò)程。腫瘤專(zhuān)家便可以通過(guò)檢查腫瘤細(xì)胞來(lái)判斷其是否響應(yīng)治療或者出現(xiàn)了阻力。
大數(shù)據(jù)可以和I-SPY的臨床測(cè)試結(jié)合,I-SPY是一種實(shí)驗(yàn)性乳腺癌藥物的臨床試驗(yàn)?!肝覀冋趶牟∪松砩蠈?shí)時(shí)收集數(shù)據(jù)。」加州大學(xué)舊金山分校分子腫瘤學(xué)家Laura van’t Veer說(shuō)。
病人在進(jìn)行診斷的時(shí)候,可以通過(guò)其腫瘤特征來(lái)將其劃歸為8種預(yù)先定義的腫瘤類(lèi)型之一。然后病人將接受標(biāo)準(zhǔn)的治療方法,并且使用實(shí)驗(yàn)性的靶向藥物,同時(shí)van’t Veer及其同時(shí)則監(jiān)測(cè)究竟腫瘤會(huì)響應(yīng)哪種治療方式。這樣做的目的是評(píng)估改善響應(yīng)靶向治療的生物標(biāo)志物?!竿ㄟ^(guò)標(biāo)準(zhǔn)治療方法,我們發(fā)現(xiàn)30-35%的病人癥狀完全緩解,而在我們八種類(lèi)型的治療方法,這個(gè)比例提升到了50-60%。」
前進(jìn)道路上仍然還有許多挑戰(zhàn)。單個(gè)腫瘤也可能隨著時(shí)間的改變而發(fā)生突變,從而使得單個(gè)腫瘤也具有多樣性。但是Ma’ayan仍然保持樂(lè)觀?!竿ㄟ^(guò)在這個(gè)問(wèn)題上投入更多的金錢(qián)和精力,我們就能獲得更多的數(shù)據(jù)。有了更好的堅(jiān)定的決心,我們可以進(jìn)一步提高對(duì)這個(gè)過(guò)程的理解。盡管現(xiàn)在感覺(jué)前路漫漫,但這并不是一個(gè)無(wú)限的過(guò)程?!?/p>
來(lái)源:百度百家
刷新相關(guān)文章
我要評(píng)論
人物專(zhuān)訪more >
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車(chē)
-
3數(shù)據(jù)智能 無(wú)限未來(lái)—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
9#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會(huì)丨《云MSP發(fā)展白皮書(shū)》重