大數(shù)據(jù)時(shí)代的悖論:更多數(shù)據(jù)真的會(huì)帶來更好的決定嗎?
福布斯 | 2016-06-20 14:10
【數(shù)據(jù)猿導(dǎo)讀】 充足的數(shù)據(jù)就像是一鍋粥,而噪聲和偏見就像老鼠屎能夠破壞整鍋粥的味道。而問題是當(dāng)我們不斷往鍋中投入食材(數(shù)據(jù)),整鍋粥并不會(huì)因此重新回歸到正確的味道,反而會(huì)增強(qiáng)偏見的存在。在這樣的情況下,小型且更平衡的數(shù)據(jù)池或許可以散發(fā)出更迷人的香氣。事實(shí)上,正是這種信念在龐大的數(shù)據(jù)...

在“大數(shù)據(jù)”時(shí)代的很多領(lǐng)域流傳著這樣一句諺語:如果你擁有的數(shù)據(jù)越多,那么所能做出的決定就會(huì)更加得精準(zhǔn)。那么在現(xiàn)實(shí)生活中真的是這樣嗎?又或者如我過去所指出的,我們現(xiàn)在所獲得的分析比以前更沒有代表性嗎?
一個(gè)非常典型的例子就是全球肥胖率,讓我們意識(shí)到擁有更多的數(shù)據(jù),甚至是實(shí)時(shí)數(shù)據(jù),如果沒有意愿或者沒有足夠毅力和耐力采取實(shí)際行動(dòng)那么這些數(shù)據(jù)的價(jià)值是微乎其微的。當(dāng)代的普通市民從未像現(xiàn)在一樣存在足夠多的方式來監(jiān)控健康的方方面面。聯(lián)網(wǎng)體重秤在每天清晨能夠記錄我們的體重;智能手機(jī)端的條形掃描能夠記錄我們消耗的每個(gè)卡路里;心率傳感器和血氧傳感器能夠每隔幾秒監(jiān)控我們的劇烈運(yùn)動(dòng);計(jì)步器能夠追蹤你的步數(shù);從血壓計(jì)到葡萄糖計(jì)的大量其他醫(yī)療設(shè)備都能傳達(dá)關(guān)乎我們健康生活的精準(zhǔn)數(shù)據(jù)。而這個(gè)不斷膨脹的市場(chǎng)甚至出現(xiàn)了要求血液和基因測(cè)試的產(chǎn)品。
那么為什么在這些能夠頻繁接觸各種健康監(jiān)測(cè)設(shè)備的國家內(nèi)肥胖率卻不斷刷新歷史最高記錄?我們只需要點(diǎn)幾下鼠標(biāo)就能基于最近幾天的鍛煉方式和每天記錄的體重變化來提供獨(dú)立個(gè)體的理想卡路里攝入,但是為何這些精準(zhǔn)的數(shù)據(jù)無法轉(zhuǎn)換成為完美的健康哪?這是一個(gè)非常值得深思的問題,我們正激發(fā)出“龐大的創(chuàng)新力”來發(fā)掘欺詐設(shè)備的各種方式,而不是將它們作為工具來改善我們的健康。
問題是訪問這些數(shù)據(jù)并非簡(jiǎn)單地等同于充分利用這些數(shù)據(jù)。正如我在今年三月份所指出的,美國政府不乏龐大的精細(xì)數(shù)據(jù),但是缺乏處理數(shù)據(jù)的專業(yè)技能和授權(quán)并將所有的數(shù)據(jù)轉(zhuǎn)換到具體措施。一家典型的美國服裝公司通常具備龐大的數(shù)據(jù)監(jiān)測(cè)從 T 恤開始縫的第一針開始到 T 恤被消費(fèi)者購買并帶出商店的整個(gè)過程的運(yùn)作。而問題是如何將這些復(fù)雜的數(shù)據(jù)串聯(lián)整合起來用于解決商業(yè)挑戰(zhàn)
我所接觸的太多公司和機(jī)構(gòu)都視“大數(shù)據(jù)”孵化和數(shù)據(jù)分析是充滿神奇力量的解決方案,簡(jiǎn)單地認(rèn)為只需要獲得足夠多的數(shù)據(jù)能夠立即推動(dòng)現(xiàn)有的業(yè)務(wù)。近年來多家公司瘋狂投資物理和數(shù)字傳感器并嘗試和現(xiàn)有業(yè)務(wù)進(jìn)行融合,然而他們都還沒有搞清楚所有這些數(shù)據(jù)希望能夠解答什么樣的問題,且在這樣匆忙地部署傳感器到現(xiàn)有公司生態(tài)系統(tǒng)中是否會(huì)產(chǎn)生盲點(diǎn)等等。事實(shí)上,這種情況已經(jīng)在社會(huì)多媒體分析領(lǐng)域存在,我經(jīng)常能夠看到公司憑借令人難以置信的高分辨率社交媒體地理上來映射社會(huì)觀點(diǎn),與此同時(shí)卻忽略了在這些地圖上依然處于黑暗中的地區(qū),創(chuàng)建了其他分析師在其他分析渠道從未關(guān)注的盲區(qū)。
在數(shù)據(jù)社區(qū)存在這樣一種共識(shí):充足的數(shù)據(jù)就像是一鍋粥,而噪聲和偏見就像老鼠屎能夠破壞整鍋粥的味道。而問題是當(dāng)我們不斷往鍋中投入食材(數(shù)據(jù)),整鍋粥并不會(huì)因此重新回歸到正確的味道,反而會(huì)增強(qiáng)偏見的存在。在這樣的情況下,小型且更平衡的數(shù)據(jù)池或許可以散發(fā)出更迷人的香氣。事實(shí)上,正是這種信念在龐大的數(shù)據(jù)面前催生出糾正導(dǎo)致情感分析領(lǐng)域迷失所有弊端的能量。
信息過載同樣也是驅(qū)動(dòng)迫使人類朝人工智能(AI)聊天機(jī)器人發(fā)展的重要因素。當(dāng)企業(yè)爭(zhēng)奪越來越多的大數(shù)據(jù),他們已經(jīng)不再能夠在龐大的顯示器面前簡(jiǎn)單地挖掘包含數(shù)千項(xiàng)指標(biāo)的所有數(shù)據(jù)。他們需要人工智能來對(duì)所有數(shù)據(jù)進(jìn)行篩選并總結(jié)預(yù)判事物未來的走向。
事實(shí)上,昨天華盛頓郵報(bào)刊登了極具震撼力的新聞報(bào)道,當(dāng)醫(yī)生被接二連三的自動(dòng)警報(bào)淹沒的時(shí)候那些在醫(yī)院接受治療的患者卻承受了極大的痛苦。在未來電子醫(yī)療記錄系統(tǒng)將會(huì)聚合不斷發(fā)展的詳盡醫(yī)療指標(biāo),通過減少醫(yī)療錯(cuò)誤的精準(zhǔn)算法讓接近于無限次的合理交互和豐富的領(lǐng)域知識(shí)儲(chǔ)備逐漸成型。換言之,你可以設(shè)想乘坐一輛無人駕駛汽車在繁忙的城市街道穿行,那么人類駕駛員可以幸福地不去關(guān)注車輛前方有什么東西,無人駕駛汽車的豐富傳感器能夠避免數(shù)千種潛在危險(xiǎn)并預(yù)估實(shí)際上可能會(huì)產(chǎn)生什么后果。以醫(yī)療警報(bào)為例,合法警報(bào)容易在大量的誤報(bào)中丟失,那么同樣可以引申這樣的觀點(diǎn)--大部分網(wǎng)絡(luò)安全警報(bào)容易在合法卻不恰當(dāng)?shù)牧髁可蟻G失。
綜上所述,或許大數(shù)據(jù)今后的焦點(diǎn)應(yīng)該更少的集中在通過任意部署來收集越來越多的數(shù)據(jù),而是更多的聚焦到如何篩選能夠反應(yīng)所提問題的小型輔助數(shù)據(jù)流上。又或者隨著人工智能的成熟,在未來能夠競(jìng)爭(zhēng)應(yīng)付無限龐大的數(shù)據(jù)并解決處理所有的問題。在文章的最后,給企業(yè)的一點(diǎn)建議是必須更少的依賴數(shù)據(jù)收集而應(yīng)該花費(fèi)更多的時(shí)間和精力去深挖如何對(duì)數(shù)據(jù)進(jìn)行分析。
來源: TECH2IPO
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會(huì)2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過的資訊
-
1【金猿案例展】中國銀聯(lián):以內(nèi)外聯(lián)動(dòng)的數(shù)
-
2【報(bào)名倒計(jì)時(shí)1周】P4個(gè)體化醫(yī)學(xué)60+殿堂
-
3全棧云原生產(chǎn)品戰(zhàn)略升級(jí),時(shí)速云領(lǐng)跑云原
-
4新趨勢(shì)·新未來 | 2019第六屆中國嬰幼
-
5【金猿產(chǎn)品展】中原銀行智能化BI:一站式
-
6【金猿產(chǎn)品展】易觀方舟:智能用戶數(shù)據(jù)中
-
7【金猿人物展】張涵誠: 2020年大數(shù)據(jù)產(chǎn)
-
8小飯桌2019全球青年創(chuàng)業(yè)者大會(huì)圓滿舉辦,
-
9繁華之下有隱憂,零售企業(yè)如何走出增長困
-
10【金猿產(chǎn)品展】羽扇決策引擎平臺(tái):運(yùn)籌帷