與智能軟件聯(lián)姻,大數(shù)據(jù)到底顛覆了什么?
千家智客 | 2016-05-09 15:13
【數(shù)據(jù)猿導(dǎo)讀】 今天不管是在中國還是世界,都流行著這樣一個概念——大數(shù)據(jù)。在潮涌般的媒體報道、論文研究、專著解讀中,“大數(shù)據(jù)”這一熱詞被不同利益群體以不同角度,進行截然不同的解讀,讓人難以琢磨

面臨新鮮事物帶來的商機以及創(chuàng)新突圍的壓力,不少企業(yè)還沒有弄清何為大數(shù)據(jù),為什么要做大數(shù)據(jù),就開始唯恐落后地“大力投入”。
4月26日,在千家智客與華南理工大學(xué)新聞與傳播學(xué)院聯(lián)合策劃舉辦的“大數(shù)據(jù)與智能品牌用戶體驗研討會上,智能算法與智能軟件研究所主任黃翰,向大家分享了他多年來在大數(shù)據(jù)方面積累的經(jīng)驗。
何為大數(shù)據(jù)?
想要將自己的產(chǎn)品、技術(shù)或者服務(wù)裝進大數(shù)據(jù)這個籮筐中圖存發(fā)展,首先就要厘清大數(shù)據(jù)的概念。2001年,在全球IT咨詢服務(wù)巨頭Gartner工作的分析師DougLaney第一次提出了一個三維模型,用來分析數(shù)據(jù)增長帶來的挑戰(zhàn)和機會。
這三個維度分別是:超大數(shù)據(jù)量(Volume)、時效性(Velocity)和多樣性(Variety)。但是僅僅這樣理解大數(shù)據(jù)還是不夠的。黃翰教授在DougLaney 3V的基礎(chǔ)上又增加了一個V,即高價值(VALUE)。
在研討會上,黃翰教授指出與其將4V稱之為維度還不如說是特征來得合適些。以超大數(shù)據(jù)量來說,大數(shù)據(jù)的“大”已經(jīng)不能用人們所熟知的GB、TB為單位來衡量了。2006年,個人用戶才剛剛邁進TB時代,全球就一共新產(chǎn)生了約180EB的數(shù)據(jù)。
有市場機構(gòu)預(yù)測,到2020年,整個世界的數(shù)據(jù)量將會增長44倍,達到35.2ZB,相當(dāng)于10億TB。(1PB=1024TB,1EB=1024PB,1ZB=1EB)。
如果對這些數(shù)據(jù)單位還沒有直觀印象的話,不妨看一下這個例子:Facebook一分鐘內(nèi)就能產(chǎn)出350GB的數(shù)據(jù)量,用戶累計點擊180萬次“贊”按鈕,甚至每一秒就有41000個帖子發(fā)布。
第二個特征是多樣性。大數(shù)據(jù)的來源種類包羅萬象,十分多樣化。如果把資料分類的話,最簡單的方法是分兩類,結(jié)構(gòu)化與非結(jié)構(gòu)化。
黃翰教授表示,早期的非結(jié)構(gòu)化資料主要是文字,隨著網(wǎng)路的發(fā)展,又?jǐn)U展到電子郵件、網(wǎng)頁、社交媒體、視訊,音樂、圖片等等,這些非結(jié)構(gòu)化的資料造成儲存(storage)、探勘(mining)、分析(analyzing)上的困難。
第三個特征是時效性。“大數(shù)據(jù)就是要告訴大家原來不知道的東西,因此時效性很重要,如果沒有時效性大數(shù)據(jù)就會失去魅力。”黃翰教授在研討會上表示。
以雙十一“剁手促銷”來說,利用大數(shù)據(jù),企業(yè)可以基于消費者的位置、購買歷史等,分析出其喜歡的商品,并實時推送,創(chuàng)造可觀的營收。時間就是金錢,這些數(shù)據(jù)都需要即是做出反應(yīng),否則就會失去參考價值。
最后一個特征是高價值,也是企業(yè)最關(guān)心的。黃翰教授指出,大數(shù)據(jù)將在政府公共服務(wù)、醫(yī)療服務(wù)、零售業(yè)、制造業(yè)以及涉及個人位置服務(wù)等領(lǐng)域得到廣泛的應(yīng)用,并產(chǎn)生巨大的社會價值和產(chǎn)業(yè)空間。以公共管理為例,歐洲的公共管理大數(shù)據(jù)每年有2500億歐元的潛在價值,比希臘的GDP還高。
在會上,黃教授還指出,“需要明確的是,大數(shù)據(jù)取決于數(shù)據(jù)規(guī)模、結(jié)構(gòu)復(fù)雜性和關(guān)聯(lián)性,某個公司的數(shù)據(jù)量大并不等于公司具備擁有和利用大數(shù)據(jù)的背景。”
智能分析,大數(shù)據(jù)的未來之路
可以說,大數(shù)據(jù)無處不在。那么有了大數(shù)據(jù)以后應(yīng)該如何獲取有用價值呢?“針對大數(shù)據(jù)的智能分析軟件是很好的選擇。”黃翰教授給出了自己的見解,利用智能分析軟件可以將大數(shù)據(jù)中蘊含的價值進行提純。
以海量視頻內(nèi)容智能分析軟件為例,現(xiàn)在監(jiān)控攝像頭遍布家庭、超市、道路等場所,具有非常高的利用價值,但是卻一直得不到重視。
據(jù)統(tǒng)計,廣東省平安城市的視頻采集點超過230萬個,每天產(chǎn)生的數(shù)據(jù)量高達253000TB。利用智能分析軟件對這些海量視頻進行挖掘提純,將會對快速、精準(zhǔn)地打擊恐怖行為、犯罪活動提供有力幫助。
另外,黃翰教授還在現(xiàn)場分享了海量人臉庫智能分析軟件。據(jù)介紹,人臉庫智能分析軟件利用的是基于五官比例特征的快速人臉識別方法。
這里不得不提到一款俄羅斯的智能分析軟件Find Face,它是一款基于大數(shù)據(jù)的智能臉部分析軟件。
根據(jù)臉部一些特殊的結(jié)構(gòu),F(xiàn)indFace的發(fā)明者寫出了臉部識別技術(shù)算法,并與現(xiàn)有的人臉圖片進行連接。用戶只要把要搜索的圖片進行輸入,就能輕松找到自己想要找的人。
“除了能完成個人用戶的識別需求外,海量人臉庫智能分析軟件還能協(xié)助警察破案。”2015年,外逃18年、多次變換身份的境外逃犯謝仁良被上海警方抓獲。利用的就是人臉識別技術(shù)。在謝仁良入境時,邊檢部門通過人臉識別和大數(shù)據(jù)分析提供的線索,將其鎖定。
值得注意的是,逃犯即使整容也辦法逃出法網(wǎng)。黃教授解釋說,因為人的某些面部特征,即使是整容,也無法改變,比如眼瞳孔之間的距離等。
除此之外,大數(shù)據(jù)與智能軟件碰撞的火花還在商務(wù)、教育、健康、飲食等領(lǐng)域得到大發(fā)展,火勢正猛。借用智能分析軟件分析大數(shù)據(jù),進行消費者細分,能夠幫助企業(yè)更精準(zhǔn)地投放廣告、設(shè)計產(chǎn)品,提高收入。
結(jié)語:大數(shù)據(jù)漸成趨勢已是必然,對于企業(yè)來說緊跟潮流,學(xué)習(xí)和思考大數(shù)據(jù)固然重要。但是更為重要的是不能成為一個機會主義者,邯鄲學(xué)步、東施效顰。如果自身沒有配套的操作系統(tǒng)、云平臺或數(shù)據(jù)分析技術(shù),可以暫且觀望或者求助外援。
來源:千家智客
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重