大數(shù)據(jù)時代:谷歌創(chuàng)始人科學(xué)研究對抗帕金森癥
Kathy | 2015-12-08 18:19
【數(shù)據(jù)猿導(dǎo)讀】 谷歌聯(lián)合創(chuàng)始人謝爾蓋·布林因家族遺傳帕金森病史,坐擁百億家產(chǎn),卻一直走在預(yù)防病癥的道路上,作為IT行業(yè)領(lǐng)軍人物,大數(shù)據(jù)沒有理由不被其所應(yīng)用,利用大數(shù)據(jù)對疾病進(jìn)行科學(xué)研究也成為了布林生活的一部分

谷歌聯(lián)合創(chuàng)始人謝爾蓋·布林(Sergey Brin)經(jīng)常練習(xí)跳水。“跳水這項(xiàng)運(yùn)動短暫而劇烈,”他說。“可以馬上提高心跳速率。”
但跳水對他來說還有另外一個好處。從家族遺傳學(xué)的角度來看,布林患上帕金森癥的風(fēng)險很高,而每跳一次水,這種風(fēng)險就會減少一點(diǎn)點(diǎn)。在布林身體的每個細(xì)胞內(nèi),12號染色體的LRRK2基因都存在一種基因突變,它與帕金森癥的發(fā)病率關(guān)系密切。
不是每個有這種基因突變的人都會患上帕金森癥,但它確實(shí)增加了患病機(jī)會。普通美國人患這種病的風(fēng)險約為1%,但有這種基因突變的人患病率達(dá)到30%-75%。從布林本人的DNA來看,他患病的可能性是50%。所以他采取了一些保養(yǎng)措施,運(yùn)動、喝咖啡、喝綠茶……用環(huán)境因素來抵消DNA的影響。
他說,“飲食、運(yùn)動這些方法,可以讓我的患病風(fēng)險下降一半,到25%左右。”他覺得,神經(jīng)科學(xué)的穩(wěn)步發(fā)展,會把這種風(fēng)險再降低一半,把可能性降至13%左右。雖然這些是推測,不過他解釋得有理有據(jù),讓人信服。
當(dāng)然布林絕不是普通人,他擁有百億美元身家,這為他提供了額外的好處。自從知道自己攜帶LRRK2基因突變之后,布林捐獻(xiàn)了至少5000萬美元給帕金森癥研究活動,他認(rèn)為這筆錢可以“真正改變局面”。隨著研究活動的增多,布林再次調(diào)整了自己的整體患病風(fēng)險,“風(fēng)險下降到10%以下。”這仍然普通美國人的10倍水平,但已經(jīng)比他本身50%的患病風(fēng)險下降了很多。
谷歌風(fēng)格的科學(xué)
這聽起來如此務(wù)實(shí),如此顯而易見,差點(diǎn)讓大家忽視了一個驚人的事實(shí):很多慈善家都資助了某些疾病的研究,他們自己也被診斷出患有這些疾病。但是,布林可能是第一個基于基因測試而捐獻(xiàn)科研經(jīng)費(fèi),希望自己避免患上某種疾病的人。
布林的做法值得注意還有另一個原因。這不僅是一種公益科研創(chuàng)投,而且布林是在尋求一種完全不同的科學(xué)。大多數(shù)帕金森癥研究工作,就像一般醫(yī)學(xué)研究一樣,依靠的也是傳統(tǒng)的科學(xué)方法:假設(shè)、分析、同行評審、發(fā)表論文。但布林提出了一種不同的方法,使用計(jì)算能力和海量數(shù)據(jù)集來推動研究。這種方法來源于他對算法的理解,帶有谷歌那種對計(jì)算能力的信心,目的是加快科研步伐,增進(jìn)科研潛力。“我已經(jīng)習(xí)慣了互聯(lián)網(wǎng)界,在我看來,醫(yī)學(xué)界的研究步伐簡直和冰川移動一樣緩慢,”布林說。“我們可以查找很多東西,收集大量信息。如果能發(fā)現(xiàn)一個模式,就有可能找到出路。”
換句話說,布林希望另辟蹊徑,繞開盛行了幾個世紀(jì)的科學(xué)認(rèn)識論,轉(zhuǎn)向一種更具谷歌風(fēng)格的科學(xué)。他想先收集數(shù)據(jù),再假設(shè),然后發(fā)現(xiàn)有價值的模式。而且他也擁有足夠的資金和算法武器來做到這一點(diǎn)。
家族遺傳
布林對數(shù)字的信心,對“知識就是力量”的信心,來源于家族傳承,他的父母都是俄羅斯裔科學(xué)家。布林的母親在1996年出現(xiàn)一些癥狀時,聯(lián)想到自己姑媽患上帕金森癥的經(jīng)過。但當(dāng)時科學(xué)界認(rèn)為帕金森氏是不會遺傳的,所以布林并不理解母親的擔(dān)心。“我認(rèn)為她想太多了,太不理性。”他說。然而經(jīng)過進(jìn)一步的測試之后,布林的母親在1999年被診斷出患有帕金森癥。
LRRK2基因突變和帕金森癥的關(guān)系是在2004年發(fā)現(xiàn)的。2006年,布林的妻子安妮·沃西基(Anne Wojcicki)創(chuàng)辦了個人基因公司23andMe(谷歌是投資者之一)。布林作為alpha測試者,很早就看到了自己的基因組結(jié)果。不久23andMe公司就發(fā)現(xiàn),布林和他母親都有LRRK2基因突變。
布林沒有驚慌。他花了數(shù)個月來考慮此事,請教專家。但很快,他就意識將這件事保密是不切實(shí)際的。布林說,“我還不如公開此事,這個信息似乎是值得分享的,甚至可能是有趣的。”所以在2008年9月的一天,布林開了博客。第一篇文章直接就叫《LRRK2》。
有毒的知識?
從某種意義上說,我們一直在使用遺傳學(xué)來預(yù)知自己患上疾病風(fēng)險。當(dāng)我們談?wù)摷易宀∈窌r,我們主要談?wù)摰氖荄NA,是對于我們自身的健康而言,父母的健康狀況提供了什么線索。遺傳掃描只不過是一種更現(xiàn)代的方式,來把我們的家族歷史和我們的未來可能性聯(lián)系到一起。
但是DNA檢測如此精確,可能會讓人覺得化學(xué)物質(zhì)決定了命運(yùn),覺得它包含著黑暗的、冷酷無情的秘密。這就是為什么基因信息有時被說成是“有毒的知識”的原因。用斯坦福大學(xué)生物倫理學(xué)家漢克·格里利(Hank Greely)的話來說,讓人們可以直接訪問自己的遺傳信息,是徹頭徹尾的“魯莽之舉”。
在科學(xué)發(fā)展的早期,這倒也有幾分真實(shí)。但出人意料的是,基因信息“有毒”的觀念一直延續(xù)至今,可能是因?yàn)樗僭O(shè)人們?nèi)狈ψ晕伊私獾谋?。但研究表明這種假設(shè)是沒有根據(jù)的。
一項(xiàng)關(guān)于阿爾茨海默氏癥的研究稱,在告知人們患病風(fēng)險較高的壞消息時,“預(yù)期人們會做出災(zāi)難性的反應(yīng)。抑郁癥、自殺、辭掉工作,拋棄家庭。研究者想到了最壞的狀況。”
但是事實(shí)與之相反。那些被告知阿爾茨海默氏癥患病風(fēng)險較高的人,似乎能用正能量來處理這件事,在后來的生活中,他們往往選擇了更加健康的生活方式。“人們會去應(yīng)對問題,似乎并沒有產(chǎn)生任何明顯的抑郁癥狀。”
換句話說,對于看起來非常糟糕的消息,我們大多數(shù)人都會像謝爾蓋·布林那樣去應(yīng)對:研究一下我們究竟有哪些選擇,尋求建議,然后繼續(xù)生活。“每個人都面對著自己的挑戰(zhàn);每個人都有自己的問題要處理,“布林說。“這就是我的挑戰(zhàn)。它不過是我老了之后需要面對的諸多問題之一。最重要的是,我能對此做些什么?”
隨著布林對帕金森癥的日益了解,在與沃西基探討研究模型時,他意識到有一個更大膽的實(shí)驗(yàn)正在醞釀之中。
阿司匹林的教訓(xùn)
1899年,拜耳的科學(xué)家推出了阿司匹林。這種藥對感冒、腰痛和牙痛效果很好,但是它的作用機(jī)制當(dāng)時并不清楚。
直到20世紀(jì)60、70年代,科學(xué)家才開始逐步弄清阿司匹林的作用機(jī)制:阿司匹林可以抑制人體內(nèi)一種名為前列腺素的化學(xué)物質(zhì),而前列腺素會引起炎癥和疼痛。明白了這一點(diǎn),后來的一個發(fā)現(xiàn)就非常容易理解了:1988年時,人們發(fā)現(xiàn),隔天服用阿司匹林能夠明顯降低心肌梗塞。因?yàn)榘⑺酒チ忠种屏饲傲邢偎兀种屏搜ǖ男纬桑虼艘簿徒档土诵募」H蛑酗L(fēng)的風(fēng)險。
阿司匹林的“二次發(fā)現(xiàn)”,被認(rèn)為是當(dāng)代醫(yī)學(xué)研究的成就之一。但布林認(rèn)為,我們應(yīng)該從這件事中總結(jié)出另一個教訓(xùn)——在阿司匹林最初推出之后,到人們發(fā)現(xiàn)它和心臟疾病有關(guān)系之前的那數(shù)十年里,“有數(shù)以百萬計(jì)的人服用阿司匹林,獲得了額外的健康益處。”但這些益處與阿司匹林之間的關(guān)系被忽視了,因?yàn)闆]有人去關(guān)注這些病人。“所有的數(shù)據(jù)都丟失了,”布林指出。
“購物籃分析”的力量
以布林的思維方式來看,我們每個人的生活都可以為科學(xué)洞見做出貢獻(xiàn)。我們平常過日子,做出各種選擇、吃東西、服藥、做這樣那樣的事情——產(chǎn)生了所謂的“數(shù)據(jù)廢氣”(data exhaust)。在一個世紀(jì)前,你當(dāng)然不可能真正利用這種信息的價值,特別是沒有一個具體的假設(shè)來指導(dǎo)研究人員在尋找什么東西的時候。但是今天,利用現(xiàn)代計(jì)算能力,研究者可以對這些數(shù)據(jù)進(jìn)行跟蹤和分析。“我們擁有的任何經(jīng)歷,或服用的任何藥物,都是個人的信息片段,”布林說。“單獨(dú)來看它們沒有什么價值。但綜合起來,它們可以變得非常有用。”
在計(jì)算機(jī)科學(xué)中,挖掘這樣的大型數(shù)據(jù)集來找到有用的關(guān)聯(lián),這個過程被稱為購物籃分析(Market Basket Analysis),常常被用于零售購買模式的推導(dǎo)中。比如亞馬遜就用它來告訴你,“購買X商品的用戶也購買了Y商品”。
布林在斯坦福大學(xué)讀書時,就對這個領(lǐng)域進(jìn)行了研究。他在1997年的一篇論文中說,只要有了正確的算法,你可以從各種非常規(guī)的“購物籃”中找到有意義的關(guān)聯(lián)。“不夸張地說,我們的患病經(jīng)歷就可能是其中之一。”
布林對“噪音數(shù)據(jù)”有很大的容忍力,這一點(diǎn)特別能說明問題,因?yàn)獒t(yī)學(xué)界傾向于認(rèn)為“噪音數(shù)據(jù)”不是好事。生物醫(yī)學(xué)研究人員往往把實(shí)驗(yàn)限制在可以嚴(yán)格測量的問題上。但強(qiáng)調(diào)純度就意味著可供研究的病人數(shù)量比較少,也就會導(dǎo)致數(shù)據(jù)集的規(guī)模比較小,從而限制了研究的“power”,即發(fā)現(xiàn)結(jié)果為真的概率。
但是,越來越多的科學(xué)家,特別是那些有計(jì)算和信息理論背景的科學(xué)家覺得,這種研究模型是可以反轉(zhuǎn)的。為什么不從海量的數(shù)據(jù)出發(fā),來尋找模式和關(guān)聯(lián)呢?
科學(xué)的第四范式
已故的微軟研究人員、計(jì)算機(jī)科學(xué)家吉姆·格雷(Jim Gray)把這稱為“科學(xué)的第四范式”,從假設(shè)向模式演化是一個必然進(jìn)程。格雷預(yù)測,在各個學(xué)科領(lǐng)域,科學(xué)家會被數(shù)據(jù)洪水包圍,除非他們重新界定科學(xué)過程的概念,并使用大量的計(jì)算工具來處理數(shù)據(jù)。“科學(xué)世界已經(jīng)改變了,”格雷在2007年的演講中說。從現(xiàn)在開始,排在首位的將會是數(shù)據(jù)。
格雷的老東家比爾·蓋茨(Bill Gates)也在“第四范式”上壓下過一筆小賭注:波特蘭一家公司運(yùn)用大型計(jì)算來快速模擬傳統(tǒng)藥物研究的試錯法,蓋茨向其投資了1000萬美元。
謝爾蓋·布林當(dāng)然不是普通人。有多少人擁有足夠的資源來扭轉(zhuǎn)科學(xué)的曲線?又有多少人的配偶創(chuàng)辦過基因?qū)W公司?布林不僅擁有這樣的條件,而且他本人也有一種以數(shù)據(jù)為驅(qū)動力的思維方式,所以在談到基因知識的時候,他可能比我們大多數(shù)人都更加淡定。很少有人會把自己的困境當(dāng)作契機(jī),促進(jìn)一種新科學(xué)的發(fā)展,這是布林的與眾不同之處。
但是我們之中的一些人,可能有一天也會面對布林那樣的挑戰(zhàn),發(fā)現(xiàn)自己屬于某種無藥可治的疾病的高風(fēng)險人群。然后我們會更多地進(jìn)行鍛煉,開始吃不同的食物,做出各種努力,同時等待科學(xué)研究的發(fā)展。從這個角度來說,布林的故事不僅僅是一個億萬富翁的故事,也是每個人的故事。
來源:騰訊科技
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實(shí)時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重