大數(shù)據(jù)可視化正面臨哪些挑戰(zhàn)?
【數(shù)據(jù)猿導(dǎo)讀】 數(shù)據(jù)可視化為企業(yè)數(shù)據(jù)分析提供了最直觀的顯示,尤其是一些非結(jié)構(gòu)化的數(shù)據(jù),很難得到系統(tǒng)的分析,數(shù)據(jù)可視化在企業(yè)的大數(shù)據(jù)應(yīng)用中發(fā)揮重要作用。但是,目前看來(lái),數(shù)據(jù)可視化仍面臨重大挑戰(zhàn)

拓展性和動(dòng)態(tài)分析是可視化的兩個(gè)最主要的挑戰(zhàn)。舉例來(lái)說(shuō),對(duì)大型動(dòng)態(tài)數(shù)據(jù),原本A問(wèn)題的答案和B問(wèn)題的答案也許在同時(shí)應(yīng)對(duì)AB兩個(gè)問(wèn)題時(shí)就不適用了。基于可視化的方法迎接了四個(gè)挑戰(zhàn),并將它們轉(zhuǎn)化成以下的機(jī)遇。
多源:開(kāi)發(fā)過(guò)程中需要盡可能多的數(shù)據(jù)源。
體量:使用數(shù)據(jù)量很大的數(shù)據(jù)集開(kāi)發(fā),并從大數(shù)據(jù)中獲得意義。
質(zhì)量:不僅為用戶(hù)創(chuàng)建有吸引力的信息圖和熱點(diǎn)圖,還能通過(guò)大數(shù)據(jù)獲取意見(jiàn),創(chuàng)造商業(yè)價(jià)值。
高速:企業(yè)不用再分批處理數(shù)據(jù),而是可以實(shí)時(shí)處理全部數(shù)據(jù)。
大數(shù)據(jù)可視化的多樣性和異構(gòu)性(結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化)是一個(gè)大問(wèn)題。高速是大數(shù)據(jù)分析的要素。在大數(shù)據(jù)中,設(shè)計(jì)一個(gè)新的可視化工具并具有高效的索引并非易事。云計(jì)算和先進(jìn)的圖形用戶(hù)界面更有助于發(fā)展大數(shù)據(jù)的擴(kuò)展性。
可視化系統(tǒng)必須與非結(jié)構(gòu)化的數(shù)據(jù)形式(如圖表、表格、文本、樹(shù)狀圖還有其他的元數(shù)據(jù)等)相抗衡,而大數(shù)據(jù)通常是以非結(jié)構(gòu)化形式出現(xiàn)的。由于寬帶限制和能源需求,可視化應(yīng)該更貼近數(shù)據(jù),并有效地提取有意義的信息??梢暬浖?yīng)以原位的方式運(yùn)行。由于大數(shù)據(jù)的容量問(wèn)題,大規(guī)模并行化成為可視化過(guò)程的一個(gè)挑戰(zhàn)。而并行可視化算法的難點(diǎn)則是如何將一個(gè)問(wèn)題分解為多個(gè)可同時(shí)運(yùn)行的獨(dú)立的任務(wù)。
高效的數(shù)據(jù)可視化是大數(shù)據(jù)時(shí)代發(fā)展進(jìn)程中關(guān)鍵的一部分。高維可視化越有效,識(shí)別出潛在的模式、相關(guān)性或離群值的概率越高。
大數(shù)據(jù)可視化還有以下幾點(diǎn)問(wèn)題:
視覺(jué)噪聲:在數(shù)據(jù)集中,大多數(shù)對(duì)象之間具有很強(qiáng)的相關(guān)性。用戶(hù)無(wú)法把他們分離作為獨(dú)立的對(duì)象來(lái)顯示。
信息丟失:減少可視數(shù)據(jù)集的方法是可行的,但是這會(huì)導(dǎo)致信息的丟失。
高速圖像變換:用戶(hù)雖然能觀察數(shù)據(jù),卻不能對(duì)數(shù)據(jù)強(qiáng)度變化做出反應(yīng)。
大型圖像感知:數(shù)據(jù)可視化不僅受限于設(shè)備的長(zhǎng)寬比和分辨率,也受限于現(xiàn)實(shí)世界的感受。
高性能要求:在靜態(tài)可視化幾乎沒(méi)有這個(gè)要求,因?yàn)榭梢暬俣容^低,性能的要求也不高。
可感知的交互的擴(kuò)展性也是大數(shù)據(jù)可視化面臨的挑戰(zhàn)。可視化每個(gè)數(shù)據(jù)點(diǎn)都可能導(dǎo)致過(guò)度繪制而降低用戶(hù)的辨識(shí)能力,通過(guò)抽樣或過(guò)濾數(shù)據(jù)可以刪去離群值。查詢(xún)大規(guī)模數(shù)據(jù)庫(kù)的數(shù)據(jù)可能導(dǎo)致高延遲,降低交互速率。
在大數(shù)據(jù)的應(yīng)用程序中,大規(guī)模數(shù)據(jù)和高維度數(shù)據(jù)會(huì)使進(jìn)行數(shù)據(jù)可視化變得困難。當(dāng)前大多數(shù)大數(shù)據(jù)可視化工具在擴(kuò)展性、功能和響應(yīng)時(shí)間上表現(xiàn)非常糟糕??梢暬治鲞^(guò)程中,不確定性是有效的考慮不確定性的可視化過(guò)程巨大挑戰(zhàn)。
可視化和大數(shù)據(jù)面臨許多的挑戰(zhàn),下面是一些可能的解決方法:
1. 滿足高速需要:一是改善硬件,可以嘗試增加內(nèi)存和提高并行處理的能力。二是許多機(jī)器會(huì)用到的,將數(shù)據(jù)存儲(chǔ)好并使用網(wǎng)格計(jì)算方法。
2. 了解數(shù)據(jù):請(qǐng)合適的專(zhuān)業(yè)領(lǐng)域人士解讀數(shù)據(jù)。
3. 訪問(wèn)數(shù)據(jù)質(zhì)量:通過(guò)數(shù)據(jù)治理或信息管理確保干凈的數(shù)據(jù)十分必要。
4. 顯示有意義的結(jié)果:將數(shù)據(jù)聚集起來(lái)到一個(gè)更高層的視圖,在這里小型數(shù)據(jù)組和數(shù)據(jù)可以被有效地可視化。
5. 處理離群值:將數(shù)據(jù)中的離群值剔除或?yàn)殡x群值創(chuàng)建一個(gè)單獨(dú)的圖表。
來(lái)源:hello大數(shù)據(jù)
刷新相關(guān)文章
我要評(píng)論
人物專(zhuān)訪more >
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車(chē)
-
3數(shù)據(jù)智能 無(wú)限未來(lái)—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
9#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會(huì)丨《云MSP發(fā)展白皮書(shū)》重