【視頻】數(shù)據(jù)猿專訪聚道科技CEO李廈戎:基因數(shù)據(jù)的價值是什么?
大文 | 2017-01-16
【數(shù)據(jù)猿導(dǎo)讀】 海量的基因數(shù)據(jù)無論是從存儲、挖掘還是協(xié)作來看,對于存儲和計算資源都是個不小的挑戰(zhàn),而資源彈性、穩(wěn)定低廉、簡便易用的云計算正是應(yīng)對挑戰(zhàn)的最好模式。于是,一批擁有云服務(wù)和大規(guī)模數(shù)據(jù)平臺背景的新興公司迅速崛起,成為基因行業(yè)產(chǎn)業(yè)鏈中重要的一環(huán)。

來源:數(shù)據(jù)猿 記者:大文
隨著基因測序成本持續(xù)降低以及國家精準醫(yī)學(xué)計劃的提出,基因數(shù)據(jù)重要性日益凸顯,得到越來越廣泛的應(yīng)用。基因測序產(chǎn)生的數(shù)據(jù)對于臨床決策支持、疾病預(yù)防控制、新藥研發(fā)和基礎(chǔ)研究等方面都具有重大意義。
隨之而來的則是基因數(shù)據(jù)產(chǎn)出量的劇增。海量的基因數(shù)據(jù)無論是從存儲、挖掘還是協(xié)作來看,對于存儲和計算資源都是個不小的挑戰(zhàn),而資源彈性、穩(wěn)定低廉、簡便易用的云計算正是應(yīng)對挑戰(zhàn)的最好模式。于是,一批擁有云服務(wù)和大規(guī)模數(shù)據(jù)平臺背景的新興公司迅速崛起,成為基因行業(yè)產(chǎn)業(yè)鏈中重要的一環(huán)。
GeneDock(聚道科技)就是其中之一。聚道科技創(chuàng)始人李廈戎此前是阿里巴巴友盟的首席數(shù)據(jù)科學(xué)家,2014年9月創(chuàng)立了GeneDock。GeneDock是國內(nèi)領(lǐng)先大領(lǐng)先的企業(yè)級組學(xué)數(shù)據(jù)管理分析平臺,為用戶提供專業(yè)的組學(xué)數(shù)據(jù)傳輸、生物信息分析、臨床與科研數(shù)據(jù)管理與協(xié)作的整體解決方案。
基因數(shù)據(jù)有何特殊之處?基因行業(yè)是否適合創(chuàng)業(yè)?帶著這些問題,數(shù)據(jù)猿對聚道科技CEO李廈戎進行了專訪。
數(shù)據(jù)猿:為什么會選擇在基因數(shù)據(jù)行業(yè)創(chuàng)業(yè)?
李廈戎:
有一次實際上跟朋友聊天,知道了基因檢測這個方向。其實很多跟我一樣的互聯(lián)網(wǎng)從業(yè)者,或者我們叫做“IT民工”,其實對生物學(xué)并不是特別了解,可能從高考之后就不知道生物的進展是什么。當(dāng)然我們之前聽過人類基因組計劃,但是時隔十幾年之后,基因組其實現(xiàn)在已經(jīng)發(fā)展到了一個比較成熟的階段。就是我們能用一個比較低的成本,將一個人的基因組的數(shù)據(jù)給測出來。
我當(dāng)時就感覺到這個數(shù)據(jù)未來會扮演很重要的角色,而且它實際上是在幫助我們?nèi)チ私庾约?,幫助我們?nèi)ッ鎸芏辔覀儗⒁媾R的包括疾病、健康甚至環(huán)境的一些問題。所以我覺得這個領(lǐng)域,其實是一個很重要的數(shù)據(jù)領(lǐng)域,這個領(lǐng)域同樣需要我們之前比較熟悉的那套計算的系統(tǒng)和大數(shù)據(jù)的技術(shù)。所以我覺得應(yīng)該把這些技術(shù)用到這個領(lǐng)域來。我覺得基因組這個事情,當(dāng)我有你的數(shù)據(jù),我是能夠幫助你自己去了解你自己的。而且這個循環(huán)是正向的,因為我知道你的信息,我告訴你的風(fēng)險。我知道張三可能有家族遺傳史,告訴張三一些有用的信息,這時候?qū)λ纳钍怯泻艽蟮母纳?,也就是說你的數(shù)據(jù)能幫助你自己。這是做這個數(shù)據(jù)最大的一個意義。
所以我覺得從某種程度來講,真的能夠讓這些人,讓大家、讓每個人用自己的數(shù)據(jù),或者基于這些數(shù)據(jù)能夠為自己,甚至當(dāng)數(shù)據(jù)更多的時候,甚至能為別人做一些事情。所以我覺得這樣會發(fā)揮數(shù)據(jù)更大的價值,而不只是說我們只是形成一個商業(yè)上面的數(shù)據(jù)變現(xiàn)的方式。
數(shù)據(jù)猿:基因數(shù)據(jù)有何特殊之處?
李廈戎:
我們在整個行業(yè)上提供一個完整的面向基因組數(shù)據(jù)的解決方案。這個解決方案并不是說,我把之前的Hadoop或者Spark這樣的系統(tǒng)移到這個領(lǐng)域來就Work。因為其實Hadoop和Spark只解決計算的問題,可能Hdvs解決存儲的問題,但問題是說這些東西是直接拼湊起來就能用的嗎?一開始可能我們是這么想的,好像移過來就可以用,但是其實發(fā)現(xiàn)這個領(lǐng)域有這個領(lǐng)域特定的需求。
所以說我們現(xiàn)在正在給這個領(lǐng)域做一個比較完備的解決方案,或者說給這個數(shù)據(jù)做一個比較完備的操作系統(tǒng)。首先一個點是個體的數(shù)據(jù)量是比較大的,互聯(lián)網(wǎng)有一個比較大的區(qū)別在于,互聯(lián)網(wǎng)其實對于個體的數(shù)據(jù)量并不是很大,可能它群體會很大,可能有幾千萬個用戶,單個用戶貢獻的數(shù)量其實很小,可能就幾兆或者幾十兆,最多是這樣的級別。
但是基因領(lǐng)域單個個體,哪怕你說我做一個小Panel那都得上G級別的數(shù)據(jù)量,做到全基因組那是百G級別的數(shù)據(jù)量,所以單個個體的數(shù)據(jù)量是比較大的。而且它要求整個處理過程,因為畢竟基因組數(shù)據(jù),它的大部分的應(yīng)用會相對比較嚴謹一些。我說的嚴謹是說它可能是面向于至少是健康或者是臨床這樣的應(yīng)用,而不是娛樂化的場景。
所以說它對于數(shù)據(jù)處理的要求會更高一些,對結(jié)果的一致性,對于整個流程的規(guī)范程度,對于數(shù)據(jù)的可追溯性要求要更高一些,隱私上面要求會更高。所以不太一樣。你可以理解為,互聯(lián)網(wǎng)大部分的時候我們分析的數(shù)據(jù)并不是那么刻意的看個體,而是刻意的看群體,但基因組現(xiàn)在的在線業(yè)務(wù)大部分是看個體的,也就我們要強調(diào)每個人、每個人之間的特異性,我要找到特異性。我要找到你跟這個人不一樣。
數(shù)據(jù)猿:基因數(shù)據(jù)行業(yè)還有創(chuàng)業(yè)機會嗎?
李廈戎:
包括怎么提高數(shù)據(jù)的處理速度,怎么降低數(shù)據(jù)的處理成本??吹接幸恍┕咀龅貌诲e,包括海外的公司也做得不錯。
另外還有一方面,怎么樣對數(shù)據(jù)有更好的壓縮能力,無論對于存儲和傳輸來講都會產(chǎn)生一些價值。我覺得這些都是核心的一些技術(shù)點。
還有一些點,怎么樣去保證這個數(shù)據(jù)的安全性。保證安全性這個事上面,其實現(xiàn)在并沒有特別完整的方案,當(dāng)然你可以說可以參考國家一些標準,但是這個領(lǐng)域會有一些特殊性,所以我覺得可能是這方面。然后再看怎么樣做更好的解讀系統(tǒng),怎么樣幫助這些醫(yī)生更好的去看數(shù)據(jù),數(shù)據(jù)的可視化,操作這些數(shù)據(jù),我覺得這些都是很好的一些點。
我只能說有數(shù)據(jù)技術(shù)背景的公司,或者有數(shù)據(jù)技術(shù)研發(fā)能力的公司一定會有優(yōu)勢。這個行業(yè)我覺得并不排外,并不會覺得你跟我們不是一個行業(yè)的人我就會排斥你。而是大家覺得確實這個領(lǐng)域有比較大的空間和潛力,而且大家其實都是技術(shù)導(dǎo)向,我們接觸的這些合作伙伴都是技術(shù)導(dǎo)向,大家覺得只要技術(shù)好、只要產(chǎn)品好,為什么不能合作呢?所以我覺得大家合作意識,對于技術(shù)的這種關(guān)注點和這種接受度都很高。
所以我覺得,只要你是一個真正的有核心技術(shù),有數(shù)據(jù)技術(shù)能力的公司,我覺得相信能夠在這個行業(yè)里面一定會有你的一席之地。
(記者:大文 微信:discoverier)
相關(guān)閱讀:
程序員如何玩轉(zhuǎn)“深不可測”的基因大數(shù)據(jù):這個行業(yè)其實只是“數(shù)據(jù)大”丨數(shù)據(jù)猿專訪聚道科技CEO李廈戎
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新