中科院院士陳潤(rùn)生:基因大數(shù)據(jù)將帶來全新的生物和醫(yī)療產(chǎn)業(yè)
【數(shù)據(jù)猿導(dǎo)讀】 陳潤(rùn)生院士對(duì)精準(zhǔn)醫(yī)學(xué)主要有四個(gè)方面的看法,第一是精準(zhǔn)醫(yī)學(xué)的本質(zhì)是組學(xué)大數(shù)據(jù)跟臨床醫(yī)學(xué)的結(jié)合;第二,精準(zhǔn)醫(yī)學(xué)能夠促使醫(yī)療的基本概念從當(dāng)前的診斷治療轉(zhuǎn)變成健康保證;第三,精準(zhǔn)醫(yī)學(xué)帶來的基因測(cè)序數(shù)據(jù)可以促進(jìn)分子診斷和藥物設(shè)計(jì)靶點(diǎn)的相關(guān)產(chǎn)業(yè);第四,伴隨著精準(zhǔn)醫(yī)學(xué)概念而產(chǎn)生的新...

11月1日下午,首屆中國(guó)智谷大會(huì)暨人工智能與產(chǎn)業(yè)創(chuàng)新高峰論壇在江蘇南京召開,本次大會(huì)以“感知時(shí)代 智造中國(guó)”為主題。中國(guó)科學(xué)院院士、中科院生物物理所研究員陳潤(rùn)生應(yīng)邀發(fā)表演講。
陳潤(rùn)生院士因完成了中國(guó)第一個(gè)完全基因組的全部生物信息服務(wù)而知名,在演講中,他圍繞大數(shù)據(jù)在生物醫(yī)藥領(lǐng)域有著廣泛的應(yīng)用前景,以及精準(zhǔn)醫(yī)學(xué)等進(jìn)行了闡述,并指出了中國(guó)目前發(fā)展過程中面臨的挑戰(zhàn)和機(jī)遇。
陳潤(rùn)生院士對(duì)精準(zhǔn)醫(yī)學(xué)主要有四個(gè)方面的看法,第一是精準(zhǔn)醫(yī)學(xué)的本質(zhì)是組學(xué)大數(shù)據(jù)跟臨床醫(yī)學(xué)的結(jié)合;第二,精準(zhǔn)醫(yī)學(xué)能夠促使醫(yī)療的基本概念從當(dāng)前的診斷治療轉(zhuǎn)變成健康保證;第三,精準(zhǔn)醫(yī)學(xué)帶來的基因測(cè)序數(shù)據(jù)可以促進(jìn)分子診斷和藥物設(shè)計(jì)靶點(diǎn)的相關(guān)產(chǎn)業(yè);第四,伴隨著精準(zhǔn)醫(yī)學(xué)概念而產(chǎn)生的新的醫(yī)療設(shè)施,以及新的如健康師一類的職業(yè)。
最后,陳潤(rùn)生認(rèn)為,目前精準(zhǔn)醫(yī)學(xué)的挑戰(zhàn)在于如何利用基因測(cè)序門檻降低后帶來的大數(shù)據(jù),以及挖掘數(shù)據(jù)背后的價(jià)值。
據(jù)了解,本次大會(huì)由新華網(wǎng)股份有限公司和南京市經(jīng)信委主辦,清華大學(xué)智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室聯(lián)合主辦,中科院沈陽自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室、清華大學(xué)全球產(chǎn)業(yè)4.5研究院等機(jī)構(gòu)提供支持,新華網(wǎng)融媒體未來研究院、新華網(wǎng)移動(dòng)互聯(lián)網(wǎng)產(chǎn)品創(chuàng)新研發(fā)基地和江寧經(jīng)濟(jì)技術(shù)開發(fā)區(qū)承辦。(李根)
以下為陳潤(rùn)生院士發(fā)言實(shí)錄:
陳潤(rùn)生:尊敬的各位專家、各位領(lǐng)導(dǎo)、非常榮幸能參加這個(gè)會(huì),我想今天我就大數(shù)據(jù)和精準(zhǔn)醫(yī)學(xué)談一個(gè)看法,因?yàn)楝F(xiàn)在的大家知道,精準(zhǔn)醫(yī)學(xué)非常熱了,雖然比起人工智能還是小弟弟,但是我們知道,從2015年國(guó)際上在討論精準(zhǔn)醫(yī)學(xué)以來,在很多發(fā)達(dá)國(guó)家包括我們國(guó)家不僅僅是大家都很關(guān)心的一個(gè)領(lǐng)域,我們國(guó)家領(lǐng)導(dǎo)人也多次對(duì)于精準(zhǔn)醫(yī)學(xué)的發(fā)展都有重要的指示,而且在資助上也有具體體現(xiàn)。
所以我今天主要談精準(zhǔn)醫(yī)學(xué)的四個(gè)方面問題,大家知道,2005年1月20號(hào)美國(guó)總統(tǒng)奧巴馬在他發(fā)表的美國(guó)要開展精準(zhǔn)醫(yī)學(xué)研究,從那以后,精準(zhǔn)醫(yī)學(xué)就在全世界得到了普遍的重視,精準(zhǔn)醫(yī)學(xué)時(shí)間還不就,但是熱度很高,所以四個(gè)方面我談自己的看法,一個(gè)是跟大家交流,也希望展開一些討論。
第一個(gè)問題,精準(zhǔn)醫(yī)學(xué)的本質(zhì)是什么,核心是什么?我看到國(guó)內(nèi)有各種各樣的評(píng)論,關(guān)于討論精準(zhǔn)醫(yī)學(xué)的內(nèi)涵,各種觀點(diǎn)都有,我自己覺得,精準(zhǔn)醫(yī)學(xué)的核心其實(shí)就是一點(diǎn),非常明確,就是組學(xué)大數(shù)據(jù)跟醫(yī)學(xué)的結(jié)合,說得更具體一點(diǎn),就是組學(xué)大數(shù)據(jù)跟臨床醫(yī)學(xué)的結(jié)合。
也就是說,把組學(xué)大數(shù)據(jù)用到臨床的醫(yī)學(xué)當(dāng)中來,提高醫(yī)療診斷的準(zhǔn)確度,提高治療的效果。那么這里,包括兩層含義,一個(gè)含義是組學(xué)大數(shù)據(jù),另外一個(gè)含義是醫(yī)學(xué)。那么組學(xué)大數(shù)據(jù)又包括兩層含義,一個(gè)是組學(xué),一個(gè)是大數(shù)據(jù),我們知道,近年來,隨著臨床研究的發(fā)展,我們獲得了越來越以基因組為代表的分子水平的人類信息,這個(gè)是以前前所未有的。那么,隨著以基因組為代表的組學(xué)數(shù)據(jù)的發(fā)展,人們?cè)絹碓蕉嗟姆e累了以遺傳密碼 為代表的不僅僅是基因的信息,也包括蛋白的信息,那么后來,人們發(fā)現(xiàn),挖掘這些信息以后會(huì)得到很多的反映人類健康和疾病的信息。
所以有人提出,如果把這些信息應(yīng)用到臨床當(dāng)中來,一定會(huì)提高臨床的效果,這就是所謂精準(zhǔn)醫(yī)學(xué)的本質(zhì)含義。但是,只獲得這些遺傳密碼的信息是不夠的,大家知道,所有遺傳密碼的信息都是非常非常多的一個(gè)大數(shù)據(jù),這個(gè)大數(shù)據(jù)大家是很容易測(cè)得的,包括我們現(xiàn)在知道在我們國(guó)內(nèi),每個(gè)人花一萬塊人民幣就可以得到你的遺傳密碼,但是你得到你的遺傳密碼你是一點(diǎn)都不懂,因?yàn)檫@只有四個(gè)字,所以要讀懂他,你就要發(fā)展大數(shù)據(jù)分析的理論方法和技術(shù),所以,那么要把這些組學(xué)數(shù)據(jù)用大臨床當(dāng)中來,必須是組學(xué)數(shù)據(jù)和大數(shù)據(jù)分析方法的結(jié)合。所以一部分是組學(xué)大數(shù)據(jù),一部分是醫(yī)學(xué),兩個(gè)結(jié)合起來,就構(gòu)成了現(xiàn)在精準(zhǔn)醫(yī)學(xué)的本質(zhì)和核心,這是第一個(gè)問題,關(guān)于精準(zhǔn)醫(yī)學(xué)的本質(zhì),他也是自上實(shí)際90年代由于組學(xué)數(shù)據(jù)用到臨床當(dāng)中一不能的發(fā)展轉(zhuǎn)化成轉(zhuǎn)化醫(yī)學(xué),個(gè)體化醫(yī)學(xué),現(xiàn)在從2011年有出了精準(zhǔn)醫(yī)學(xué)的名稱,但不管怎么說,都是他的本質(zhì)是清楚的,就是組學(xué)大數(shù)據(jù)在臨床醫(yī)學(xué)當(dāng)中的應(yīng)用。
第二個(gè)問題,精準(zhǔn)醫(yī)學(xué)能夠使醫(yī)學(xué)帶來哪些本質(zhì)的變化,如果精準(zhǔn)醫(yī)學(xué)只是把醫(yī)學(xué)提高一點(diǎn)點(diǎn)百分?jǐn)?shù)的話,我想,那么精準(zhǔn)醫(yī)學(xué)就不一定會(huì)引起更多領(lǐng)導(dǎo)人的注意,那么引起更多領(lǐng)導(dǎo)人的注意,就精準(zhǔn)醫(yī)學(xué)的內(nèi)涵,一定會(huì)有一些本質(zhì)上的變化,那么這個(gè)本質(zhì)上的變化是什么?我們也用一句話來說,精準(zhǔn)醫(yī)學(xué)他的本質(zhì)上所以引起各國(guó)領(lǐng)導(dǎo)人的重視,是精準(zhǔn)醫(yī)學(xué)有可能改變醫(yī)療健康的基本概念,也就是說,促使醫(yī)療的基本概念從當(dāng)前的診斷治療轉(zhuǎn)變成健康保證。我們知道,現(xiàn)在的醫(yī)療體系面對(duì)的是病人,那么他主要是對(duì)病人進(jìn)行所謂的治療,但是,未來因?yàn)榫珳?zhǔn)醫(yī)學(xué)的發(fā)展,由于組學(xué)大數(shù)據(jù)的介入,那么就會(huì)使得這個(gè)時(shí)候的健康不僅僅是對(duì)病人,而是對(duì)全民,對(duì)任何人在他沒有得病的時(shí)候我們測(cè)量他的組學(xué)數(shù)據(jù),分析組學(xué)大數(shù)據(jù),那么就可以對(duì)他未來健康發(fā)展的危險(xiǎn)因素做出評(píng)估,根據(jù)評(píng)估進(jìn)行適當(dāng)干預(yù),這樣的話有些疾病不發(fā)展,有些疾病減輕他的程度,提高他的生活質(zhì)量,這樣就把整個(gè)醫(yī)療健康體系的關(guān)口前移,治胃病在沒有病之前就提出評(píng)估與保證,這樣一個(gè)根本性的概念的轉(zhuǎn)變,有人認(rèn)為,有可能導(dǎo)致一些新興產(chǎn)業(yè)的出現(xiàn),有人預(yù)估,跟所謂精準(zhǔn)醫(yī)學(xué)相關(guān)的這這個(gè)概念轉(zhuǎn)變導(dǎo)致的新型,也許到2018年也許到2千億美元的轉(zhuǎn)變,我是不知道,這個(gè)數(shù)據(jù)是國(guó)際上的一些評(píng)估,當(dāng)然如果是2千億美金的話就相當(dāng)于2萬億人民幣,對(duì)GDP就有影響。這種有精準(zhǔn)醫(yī)學(xué)帶來的本性概念的改變由此促使的產(chǎn)業(yè)的發(fā)展當(dāng)然會(huì)引起各國(guó)領(lǐng)導(dǎo)人的注意,這是第二個(gè)方面,關(guān)于精整醫(yī)學(xué)他可能帶來的一些本質(zhì)變化的估量。
很多國(guó)家不管精準(zhǔn)醫(yī)學(xué)研究已成為新一輪國(guó)家科技競(jìng)爭(zhēng)與引領(lǐng)國(guó)際戰(zhàn)略的制高點(diǎn),美國(guó)在精準(zhǔn)醫(yī)學(xué)的發(fā)展,大家知道美國(guó)要測(cè)量100萬自然人的遺傳密碼,歐盟也在積極推動(dòng)所謂精準(zhǔn)醫(yī)學(xué)的研究,包括英國(guó)、法國(guó)等等,日本也在進(jìn)行精準(zhǔn)醫(yī)學(xué)相關(guān)的投入和計(jì)劃。那么精準(zhǔn)醫(yī)學(xué)我們?nèi)绾巫屑?xì)分析,他可能在哪些方面促使產(chǎn)業(yè)的變革和發(fā)展呢,我想至少在四個(gè)方面,第一個(gè)可以促使海量的生物樣本庫和數(shù)據(jù)庫的發(fā)展,大家知道,由于精準(zhǔn)醫(yī)學(xué)的推動(dòng),那么需要測(cè)量百萬人量級(jí)的這些人的組學(xué)信息,首先涉及到這百萬人生物樣品的獲取,保管、提取和提供給這些人使用,這當(dāng)然是一個(gè)很大的產(chǎn)業(yè)。同時(shí),這些樣本測(cè)完了數(shù)據(jù)是百萬人數(shù)量級(jí)的一定要促進(jìn)相應(yīng)的大規(guī)模的數(shù)據(jù)庫的發(fā)展,有人估計(jì),這個(gè)產(chǎn)業(yè)的規(guī)??赡苁前?億數(shù)量級(jí)。
第二個(gè)有了這些樣品,那么就要測(cè)以基因組為代表的這些組學(xué)數(shù)據(jù),所以就要測(cè)基因組、蛋白組、轉(zhuǎn)入組,這些測(cè)序的數(shù)據(jù),大家知道,現(xiàn)在已經(jīng)進(jìn)入到了所有的市民的事件當(dāng)中了,那么大家多知道,測(cè)試自己的遺產(chǎn)密碼,這樣一個(gè)測(cè)序也人估計(jì),僅僅到2018年,就可以到117億美金的規(guī)模。那么有了樣本庫,有了粗學(xué)數(shù)據(jù)的測(cè)量,那么下一步在這些海量數(shù)據(jù)挖掘的基礎(chǔ)上,就可以促進(jìn)產(chǎn)生大量的新的分子診斷的指標(biāo),我們知道,就會(huì)增加很多跟疾病相關(guān)的信息,這些信息當(dāng)中,有很多就可以作為新的疾病的標(biāo)記。同時(shí),也可以發(fā)現(xiàn)很多新的藥物設(shè)計(jì)的靶點(diǎn),這就促進(jìn)了第三個(gè)產(chǎn)業(yè)。所謂分子診斷和藥物設(shè)計(jì)靶點(diǎn)的相關(guān)產(chǎn)業(yè)。
第四個(gè)當(dāng)然伴隨著精準(zhǔn)醫(yī)學(xué)概念而產(chǎn)生的新的醫(yī)療設(shè)施,比如說要成立一些健康源,要一些健康師,這些方面是可以和現(xiàn)在醫(yī)院、醫(yī)生相關(guān)系的產(chǎn)業(yè)大概是千億數(shù)量,這些產(chǎn)業(yè)必然會(huì)帶來變革,國(guó)內(nèi)已經(jīng)有所體現(xiàn),有成百上千個(gè)小的公司在逐漸地成立了。當(dāng)然他們?cè)趺磥砀玫陌l(fā)展,有待討論。
我們國(guó)家的精準(zhǔn)醫(yī)學(xué)發(fā)展目標(biāo)我不贅述了,跟國(guó)際是一致的,這第二個(gè)方面,精準(zhǔn)醫(yī)學(xué)可以帶來哪些本質(zhì)的變化,如何促進(jìn)產(chǎn)業(yè)的發(fā)展,在那幾個(gè)產(chǎn)業(yè)發(fā)展可以帶動(dòng)或引導(dǎo)。
第三個(gè)我要說一個(gè)問題是要實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué),要做哪些點(diǎn)?做到哪些點(diǎn),才能做到精準(zhǔn)?那么精準(zhǔn)醫(yī)學(xué)我覺得至少要具備兩個(gè)條件,第一個(gè),要具備組學(xué)大數(shù)據(jù)的基礎(chǔ),我們知道,精準(zhǔn)醫(yī)學(xué)就是把組大數(shù)據(jù)用到臨床當(dāng)中來,所以第一個(gè)你要獲取組學(xué)大數(shù)據(jù),那么也就是獲取基因組,蛋白組、轉(zhuǎn)入組、代謝組等等這些組學(xué)數(shù)據(jù),這些數(shù)據(jù)本身是沒有用的,第二步就是組學(xué)數(shù)據(jù)的挖掘,挖掘的話就會(huì)用到大數(shù)據(jù)分析的理論方法,包括剛才張先生講的人工智能的方法,深度學(xué)習(xí)的方法等等,以知識(shí)為基礎(chǔ)的方法用來挖掘這些組學(xué),以獲得在分子水平上跟疾病相關(guān)的知識(shí),這是第一個(gè)基礎(chǔ)。
有了這些分子知識(shí)和組學(xué)知識(shí)的用到臨床疾病當(dāng)中來,還要建立第二個(gè)基礎(chǔ),就是搭建分子水平的以基因型為代表的信息核,建立這種橋梁之后才能有效把分子水平的信息轉(zhuǎn)化應(yīng)用到疾病的診斷和治療當(dāng)中來,那么這就是要建立所謂生物信息學(xué)、生物網(wǎng)絡(luò),系統(tǒng)生物學(xué)等等的方面,有了這兩個(gè)基礎(chǔ)我們就可以更好地實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué),當(dāng)然一個(gè)非常重要的就是精準(zhǔn)醫(yī)學(xué)的發(fā)展,是應(yīng)當(dāng)和當(dāng)前的臨床的影象學(xué)、臨床的生化檢驗(yàn)、當(dāng)前臨床的知識(shí)很好地融合下,并不是有些公司他測(cè)的序什么都決定了,實(shí)際上不是那樣,是應(yīng)該更好地結(jié)合起來才能更好做到精準(zhǔn)。精準(zhǔn)醫(yī)學(xué)只是把新的數(shù)據(jù)應(yīng)用在原有的數(shù)據(jù)上使得更好地提高。
第四個(gè)說的精準(zhǔn)醫(yī)學(xué)現(xiàn)在在什么階段,發(fā)展到什么階段?大家知道,可能我們目前精準(zhǔn)醫(yī)學(xué)成為大家的熱詞以后,大家認(rèn)為我們現(xiàn)在什么都可以精準(zhǔn),醫(yī)學(xué)很容易精準(zhǔn)了,我個(gè)人的觀點(diǎn),精準(zhǔn)醫(yī)學(xué)其實(shí)雖然是本質(zhì)上可能帶來變革,可能引導(dǎo)新的產(chǎn)業(yè)的發(fā)展,也許產(chǎn)業(yè)規(guī)模是巨大的,但是現(xiàn)在才剛剛上路,才剛剛開始!為什么?是在精準(zhǔn)醫(yī)學(xué)的概念下,我們目前依然存在著巨大的挑戰(zhàn),我們依然存在著巨大的困難。因此,我下面會(huì)舉一兩個(gè)例子來說明精整醫(yī)學(xué)目前存在什么樣的困難?
為什么說精準(zhǔn)醫(yī)學(xué)才剛剛上路呢?我們的創(chuàng)新的機(jī)遇在哪里,我們迎接挑戰(zhàn)在哪兒?我作組學(xué)當(dāng)中只舉一個(gè)例子,在我們的臨床密碼當(dāng)中,在我們的組學(xué)當(dāng)中,目前,還存在著大量的暗信息,所謂我們的臨床密碼花一萬塊錢可以測(cè)得你可以拿到自己的遺傳密碼,但是目前我們能夠分析從規(guī)律上的只有一小部分,這就是基因組當(dāng)中的所謂暗信息,這是一段人的遺傳密碼,我們?cè)谧母魑欢加校乙灿校敲聪襁@樣的遺傳密碼,很多重要的地方是影響整個(gè)人的生產(chǎn)和法語了,我們一個(gè)人是3-10個(gè)九次方,如果你花一萬塊錢很容易測(cè)一床密碼,如果轉(zhuǎn)定成側(cè),每3千個(gè)量的到一個(gè)頁,100頁壯丁層一冊(cè),如果你把自己的臨床密碼壯丁成密碼,是一萬冊(cè),每頁3千字符的東西就是你自己的遺傳密碼,我相信每個(gè)人很容易得到,你得到這個(gè)密碼你讀懂嗎,如果一萬冊(cè)書每一頁一厘米,我們自己的書就是一萬厘米,就是一白米,大家可以想像,你自己的遺傳密碼從地面上排到四十層樓房那么高,每一頁都是這樣的,你讀懂了,你就精準(zhǔn)我相信沒有誰能精準(zhǔn),我現(xiàn)在要告訴大家的是集全世界科學(xué)家的智慧,包括生物醫(yī)學(xué)家的智慧,這本天書我們集體世世界目前在什么時(shí)候,我告訴大家,世界上能夠從規(guī)律上了解的部分只有這遺傳密碼的3%,這個(gè)概念我是多次在報(bào)告對(duì)大家傳遞這樣的信息,好象大家認(rèn)為我現(xiàn)在測(cè)這個(gè)密碼都懂了,不最了,只懂3%,另外的97%實(shí)際上集目前全世界的智慧還不懂,大部分還不懂。
那么,我給大家舉一個(gè)最一般性的證明,如果大家去看,2010年,12月17號(hào)的這個(gè),大家知道每12月份的insights都會(huì)評(píng)選當(dāng)年自然科學(xué)領(lǐng)域的十大突破,2010年12月17號(hào)的這一期評(píng)論了十大科學(xué)突破,一個(gè)是當(dāng)年的,一個(gè)是人類進(jìn)入21世紀(jì)就進(jìn)入本世紀(jì)以來,全十年,把這十年加在一塊,也就是說離我們最近的十年把所有的加在一塊,自然科學(xué)領(lǐng)域不僅僅是生物醫(yī)學(xué),所有的自然科學(xué)領(lǐng)域十個(gè)最值得人們關(guān)心的事,第一個(gè)出現(xiàn)的就是這個(gè),大家很容易找到這篇,因?yàn)檫@個(gè)insights非常容易找到,他說明什么,說明我們基因組當(dāng)中,或者我們遺傳密碼當(dāng)中的Dark matter,什么意思,就是說明迄今為止我們的遺傳密碼大部分依然是暗的,就是97%是暗的,也一點(diǎn)我想在下面給大家做一些展開性的說明。
首先從遺傳密碼來講,我們其實(shí),我們的97%的遺傳密碼,從總體,從規(guī)律上來講,我們?nèi)祟愡€不了解,那3%我們了解的是從中學(xué)大家就知道的,尊崇中心發(fā)展的蛋白質(zhì)信息,那3%就是造蛋白質(zhì)的遺傳密碼,我們知道他的歸類了,也知道他的信息,但另外的97%的遺傳密碼是跟制造蛋白組無關(guān)的,這些信息,迄今為止我們不知道他做什么用的,這就是遺傳密碼當(dāng)中的所謂暗物質(zhì),也是遺傳密碼當(dāng)中的非編碼序列,那么這個(gè)概念,大家可以想一想,當(dāng)我們測(cè)遺傳密碼,而97%的密碼還不知道的情況下我們?nèi)绾巫龅骄珳?zhǔn)呢?所以離精準(zhǔn)還差了很很大的距離。
我給大家戰(zhàn)時(shí)比較基因組的例子,這是和人類基因組一起測(cè)量的模式生物,大家看到最上面最作短是大腸感知,是大細(xì)胞的圓細(xì)胞生物,連個(gè)細(xì)胞核都沒有,大家可以看到,這整個(gè)代表他的遺傳密碼,85%都是紅色的,就是85%都是用來編碼蛋白的,都是知道歸類的部分,所以對(duì)一個(gè)非常低等的生物,如果你測(cè)完他的遺傳密碼,你在85-90%你就知道他是如何生活,基本造哪些蛋白就知道,但是生物高等一點(diǎn),我們看上面中間的酵母,這個(gè)是單細(xì)胞的真核生物,生物高等一點(diǎn),你看他用來編碼蛋白質(zhì),或者與之歸類的部分減少到70%了,而非編碼的部分增加到28%,我們看最右邊這一個(gè),是仙童(音),是非常簡(jiǎn)單的多細(xì)胞生物,雖然簡(jiǎn)單,已經(jīng)也了多細(xì)胞了,好多細(xì)胞的,不是單細(xì)胞的,這時(shí)候你看編碼蛋白質(zhì)的部分減少到28%,非編碼的部分增加到71%,下面是果蠅,也就是昆蟲了,紅色的部分減少到17%,非編碼的部分增加到82%,而而97-98%都是非編碼序列,這樣一個(gè)所謂比較基因組的進(jìn)化邏輯告訴我們, 我們可能過去設(shè)務(wù)從簡(jiǎn)單到復(fù)雜,從地等到高等是蛋白來得多,不對(duì)的,實(shí)際上生物從簡(jiǎn)單到復(fù)雜,從地等到高等,增加的是迄今為止我總體上還不知道規(guī)律的非編碼序列,這將是對(duì)我們來講做精準(zhǔn)也好,做基礎(chǔ)生物來講你的巨大挑戰(zhàn),就是我們現(xiàn)在鬧明白的,其實(shí)我們測(cè)量我們的遺傳密碼以后,發(fā)現(xiàn)我們大部分目前依然不知道生物學(xué)作用。
有人要起作用要有兩個(gè)作用,一段遺產(chǎn)密碼叫基因,還有一段重要條件產(chǎn)生生物,我們的信息要發(fā)放,用生物來講這個(gè)東西,這個(gè)遺產(chǎn)密碼要轉(zhuǎn)路,第二個(gè)進(jìn)入21世紀(jì)科學(xué)家提出問題,說這些占人類基因組97%的遺產(chǎn)密碼,那是否右轉(zhuǎn)路產(chǎn)物呢,否有信息發(fā)放,換句話說,他是否在活動(dòng),在行使功能呢,這個(gè)結(jié)果我不詳細(xì)講了,這個(gè)結(jié)果是100%肯定的,找到這些非編碼序列和我們制造蛋白的那些基因一樣,每時(shí)每刻都在表達(dá),每時(shí)每刻都在起作用,所以他們也是真正地完成生物學(xué)功能,那么這些東西我可以舉幾個(gè)例子說明,他跟腫瘤的關(guān)系,當(dāng)然,雖然我們不全部了解它,但是已經(jīng)有些支離破碎的例子說明他的生物學(xué)功能。比如說有一個(gè)來自97%的這樣一個(gè)產(chǎn)物,他叫PCGEM1,可以導(dǎo)致前列腺癌,不是由于蛋白引起的,更重要的是MALAT-1,他可以導(dǎo)致分校細(xì)胞肺癌,我們大家知道我們國(guó)家肺癌是增速中,我們現(xiàn)在臨床醫(yī)院當(dāng)中,檢測(cè)腫瘤用的指標(biāo)都是我講的3%,而治療的靶點(diǎn)你用的藥物也是對(duì)那3%,我現(xiàn)在告訴你,那97%,有很多例子證明,他也與腫瘤有關(guān),但從來沒有納入到我們臨床之診斷和治療當(dāng)中來,你想這個(gè)腫瘤能治得好嗎,腦子沒有概念,你沒有考慮他,當(dāng)然沒有想到檢測(cè)和治療他,所以這個(gè)問題當(dāng)然,比如說代謝疾病也是一樣,就是說,我們還有一個(gè)97%更嚴(yán)重情況有關(guān)的東西迄今沒有那么融入到我們?cè)\斷治療的視野當(dāng)中,這就是精準(zhǔn)醫(yī)學(xué)面臨著組學(xué)的所謂的暗信息的巨大挑戰(zhàn)。
當(dāng)然也有好的,大家知道,H19這是來自非編碼序列的一個(gè)重要的東西,他可以保護(hù)我們?nèi)绻覀冇行┘?xì)胞癌變了,可以通過類似細(xì)胞凋亡的途徑消滅他,這和我們熟知的P53是一樣的,所以我們知道那個(gè)97%是和我們疾病,和我們的健康息息相關(guān)。我們有多少這樣的編碼沒有發(fā)現(xiàn)呢,大家知道,那3%大家很容易知道,我們大概有25000個(gè)基因,這是基本防治,那些97%的我們現(xiàn)在能不能評(píng)估一下,他有多少原件呢,大家知道,對(duì)人我們還不知道,因?yàn)閭惱砩系脑?,老鼠,他的遺傳研究所做過研究,把所有的原件都拿來,管你是編碼還是非編碼,一共發(fā)現(xiàn)的18萬1千個(gè),這是在老鼠里面真正執(zhí)行功能的原件的下限,實(shí)際上一定會(huì)比他大,在這里發(fā)現(xiàn),產(chǎn)生意義上3%決定了兩萬個(gè),換句話說我們還有16萬1千個(gè)來自那97%,這16萬1千個(gè)據(jù)我所知,目前我們?nèi)澜缈茖W(xué)家解析了多少,大約1千個(gè),換句話說,還有16萬個(gè)機(jī)會(huì),你發(fā)現(xiàn)一個(gè)新的功能原件,你做出他的功能,無疑他就是發(fā)表在insight的很好的,現(xiàn)在告訴大家,這還有16萬個(gè)機(jī)會(huì),有太多的機(jī)會(huì)有些非常重要的元件功能的發(fā)現(xiàn)。這些領(lǐng)域2016由這兩位就是在那97%研究當(dāng)中,我曾經(jīng)開過一個(gè)玩笑,說那3%大家算算從1900年研究那3%大約締造了50名諾爾將近獲得者,現(xiàn)在知道了還有97%,97比三,那個(gè)大約是1300左右,所以我們有一千多個(gè)機(jī)會(huì)在這個(gè)領(lǐng)域做出原創(chuàng)性的特殊的貢獻(xiàn),而只有一個(gè)位置被占據(jù),所以我們還有巨大的機(jī)會(huì)。那么這是他們賴以獲得諾貝爾獎(jiǎng)的那個(gè)論文。
因此,我們從精準(zhǔn)醫(yī)學(xué)來講,我們現(xiàn)在其實(shí)不能做的精準(zhǔn)是因?yàn)橛幸粋€(gè)巨大的大數(shù)據(jù),他的只是二指他的內(nèi)涵并沒有被挖掘,但是另一方面,他可以給我們提供一個(gè)全新的機(jī)會(huì),不管對(duì)技術(shù)研究還是產(chǎn)業(yè)發(fā)展都有巨大研究,所以對(duì)非編碼的研究無疑會(huì)對(duì)疾病的診斷治療提供全新的診斷方向,或者對(duì)藥物的設(shè)計(jì)研發(fā)提供新的平臺(tái),對(duì)新的物種,新的性狀的培育提供一個(gè)新的基礎(chǔ),對(duì)于組學(xué)的方向有很多,精準(zhǔn)醫(yī)學(xué)其實(shí)才剛剛開始,時(shí)間的關(guān)系我還有兩三分鐘,我想大數(shù)據(jù),大家都是大數(shù)據(jù)的專家,我想我只能非常快的說說題目,其實(shí)對(duì)大數(shù)據(jù)的分析,依然存在著有些核心的挑戰(zhàn),第一個(gè)數(shù)據(jù)量大,大家知道,現(xiàn)在的測(cè)序儀一個(gè)普通的一次運(yùn)行就可以到1T的數(shù)據(jù),全世界有成千上萬個(gè)這樣的儀器,包括我的組里就有所謂的得到一個(gè)T的數(shù)據(jù),所以這些數(shù)據(jù)量是非常大的。那么每個(gè)人有3×10個(gè)九次方,當(dāng)時(shí)測(cè)序的話,測(cè)他的基因組,用了100萬美金,現(xiàn)在大家知道用一萬美金就可以同樣得到自己的遺傳密碼。
這個(gè)數(shù)據(jù)告訴大家,從數(shù)據(jù)質(zhì)量來講,他的噪音很高,同時(shí)又大量缺失值的這樣一個(gè)數(shù)據(jù)源。第二個(gè)樣本很小,我們要解決腫瘤的問題,但是我們知道腫瘤的變量,自變量可能成前上萬,但是我們?nèi)颖局挥邪贁?shù)量級(jí),因此我們?yōu)槭裁匆獪y(cè),比方要研究腫瘤或者是心腦血管病,他的自身變量千數(shù)量級(jí),我們的百萬級(jí),就像政府,測(cè)一百萬人總夠了,第二個(gè),我們建立合適的數(shù)學(xué)模型,使得我們能夠相匹配,另外不僅僅是具體的基因,還牽涉到網(wǎng)絡(luò),這些網(wǎng)絡(luò)大家知道,這些網(wǎng)絡(luò)本身是動(dòng)態(tài)的,有些是不同原件的。大家知道不僅僅是組學(xué)數(shù)據(jù),還也生物學(xué)數(shù)據(jù),更需要我們不僅僅是科技界,企業(yè)界,我們知道我們國(guó)內(nèi)數(shù)據(jù)共享存在基本一個(gè)重要的問題,如果一個(gè)數(shù)據(jù)共享問題不解決,我們就是在大數(shù)據(jù)時(shí)代做小數(shù)據(jù)的工作,發(fā)表小數(shù)據(jù)的企業(yè),顯然不能適應(yīng)國(guó)際競(jìng)爭(zhēng)的態(tài)勢(shì)。所以后面我講的很粗糙,對(duì)不起,占用大家的時(shí)間,謝謝!
來源:新浪科技
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新