大數(shù)據(jù)都有哪些局限性
嚴(yán)匡正 | 2017-08-11 15:44
【數(shù)據(jù)猿導(dǎo)讀】 “每一場(chǎng)科學(xué)革命——從哥白尼的日心說(shuō)模型到統(tǒng)計(jì)學(xué)和量子力學(xué)的興起,從達(dá)爾文的進(jìn)化和自然選擇學(xué)說(shuō)到基因理論——都是由于一件事,也只是由于一件事導(dǎo)致的,那就是數(shù)據(jù)的獲取?!?

“每一場(chǎng)科學(xué)革命——從哥白尼的日心說(shuō)模型到統(tǒng)計(jì)學(xué)和量子力學(xué)的興起,從達(dá)爾文的進(jìn)化和自然選擇學(xué)說(shuō)到基因理論——都是由于一件事,也只是由于一件事導(dǎo)致的,那就是數(shù)據(jù)的獲取。”
這是達(dá)納法伯癌癥研究所生物統(tǒng)計(jì)學(xué)和計(jì)算生物學(xué)教授約翰·夸肯布什昨天主題演講中令人大開(kāi)眼界的開(kāi)頭。他也是哈佛大學(xué)陳曾熙公共衛(wèi)生學(xué)院的教授,擁有諸多學(xué)術(shù)成果。
毫無(wú)疑問(wèn),這一數(shù)據(jù)概念如今正推動(dòng)著醫(yī)療衛(wèi)生行業(yè)幾乎各個(gè)方面的轉(zhuǎn)型??淇喜际苍谫M(fèi)城的MedCity Converge大會(huì)上指出,每家醫(yī)院平均每年會(huì)產(chǎn)生大約665TB的數(shù)據(jù),其中五分之四都是以圖片、視頻或醫(yī)囑的零散形式存在的。
不過(guò)嚴(yán)重限制人們利用這些信息的因素,不是“大數(shù)據(jù)”,而是“混亂數(shù)據(jù)”。
總體來(lái)看,在那些可能有海量有用數(shù)據(jù)可供發(fā)掘的地方,我們沒(méi)有為那些真正希望使用這些數(shù)據(jù)的人提供方便之門。那些數(shù)據(jù)可能很難或很直接地獲取,或是信息量不足,或是格式不對(duì)。還有可能數(shù)據(jù)不完整,或沒(méi)有使用兼容的儲(chǔ)存“標(biāo)準(zhǔn)”(我們似乎有數(shù)不清的互相不能兼容的標(biāo)準(zhǔn))?;蛘咴诙嗑S度的領(lǐng)域里,數(shù)據(jù)只記錄了一個(gè)維度的信息。(他說(shuō):“生物系統(tǒng)是個(gè)復(fù)雜的自適應(yīng)系統(tǒng),擁有許多活動(dòng)的部件,我們只是剛剛了解了一些皮毛
另外,這些數(shù)據(jù)并不能真正給出終端用戶想要尋求的答案,這一點(diǎn)似乎是出人意料的普遍誤解。換句話說(shuō),現(xiàn)有的數(shù)據(jù)沒(méi)有目的性。
以人口統(tǒng)計(jì)數(shù)據(jù)為例,這是政府和學(xué)術(shù)機(jī)構(gòu)常規(guī)收集的數(shù)據(jù)。夸肯布什表示:“統(tǒng)計(jì)學(xué)會(huì)使用人口數(shù)據(jù),而醫(yī)學(xué)研究也會(huì)依賴人口數(shù)據(jù)。但醫(yī)療護(hù)理卻是通過(guò)個(gè)體數(shù)據(jù)推動(dòng)的。所以當(dāng)我們把(我們的數(shù)據(jù)研究)用于臨床時(shí),必須考慮如何讓個(gè)體數(shù)據(jù)以有意義的格式儲(chǔ)存而為人所用。”
他說(shuō),最終的目標(biāo)應(yīng)該是“利用不直觀的數(shù)據(jù),建立直觀的圖形化呈現(xiàn)”,從而讓非數(shù)據(jù)科學(xué)家“不必坐在終端機(jī)前輸入一系列晦澀的指令,就能對(duì)其展開(kāi)研究”。
夸肯布什表示:“在你考慮讓數(shù)據(jù)為人所用時(shí),要做的就是建立接口,讓人們能夠接觸并理解數(shù)據(jù),用他們自己的想法使用數(shù)據(jù)。”
如果不這么做,我們所有的大數(shù)據(jù)就只是大型的二進(jìn)制數(shù)據(jù)塊和越來(lái)越大的數(shù)據(jù)服務(wù)器。
怎么阻止這種情況發(fā)生 夸肯布什坦率地說(shuō),將這些未經(jīng)處理的數(shù)據(jù)變成可用數(shù)據(jù)的動(dòng)機(jī),不是提高醫(yī)療水平或讓人們過(guò)得更好。驅(qū)動(dòng)力將是所有科學(xué)中最重要的一種:經(jīng)濟(jì)學(xué)。如果我們真的打算有所進(jìn)展,就必須證明,將這種數(shù)據(jù)和信息整合起來(lái)會(huì)有利可圖。”
來(lái)源:36大數(shù)據(jù)
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
4數(shù)據(jù)智能 無(wú)限未來(lái)—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新