Taste Analytics CEO 汪曉宇:一切沒有應(yīng)用價(jià)值的大數(shù)據(jù)都是空談
【數(shù)據(jù)猿導(dǎo)讀】 當(dāng)前的大數(shù)據(jù)行業(yè),業(yè)界的關(guān)注重點(diǎn)已慢慢從基礎(chǔ)設(shè)施層,轉(zhuǎn)移到分析和應(yīng)用層面。大數(shù)據(jù)的價(jià)值,目前來看主要是應(yīng)用價(jià)值,Taste AnalyticsCEO汪曉宇覺得,沒有應(yīng)用價(jià)值的大數(shù)據(jù)一切都是空談

最近與幾位互聯(lián)網(wǎng)行業(yè)的CIO在探討一些關(guān)于大數(shù)據(jù)的問題,中國大數(shù)據(jù)研究專家,中國互聯(lián)網(wǎng)協(xié)會(huì)大數(shù)據(jù)工作委員會(huì)委員龔才春的一句“不以預(yù)測為目的的大數(shù)據(jù)都是耍流氓“語驚四座。言簡的一句話便道出了大數(shù)據(jù)的四大本質(zhì)屬性:4V+1C。
大數(shù)據(jù)的四大本質(zhì)屬性解讀
4V之一是指Volume,即體量大,但須注意數(shù)據(jù)體量與當(dāng)時(shí)的技術(shù)及應(yīng)用場景有關(guān)。
4V之二是Variety,即數(shù)據(jù)類型多,一個(gè)大數(shù)據(jù)任務(wù),一定要有各種各樣類型的數(shù)據(jù)在一塊處理,包括文本的,格式化的,非格式化的,視頻的、音頻的等等。
4V之三是Velocity,即數(shù)據(jù)的時(shí)效性,今天的大數(shù)據(jù)在明天就不一定是大數(shù)據(jù)。
4V之四是Value,即數(shù)據(jù)價(jià)值, Value應(yīng)具有兩個(gè)特性,一個(gè)是商業(yè)價(jià)值高,另一個(gè)是價(jià)值密度低。
1C則是Complex,即數(shù)據(jù)足夠復(fù)雜才能稱之為大數(shù)據(jù)。
全球大數(shù)據(jù)分析技術(shù)現(xiàn)狀
目前,中國與美國在大數(shù)據(jù)分析領(lǐng)域的差距,體現(xiàn)在理念和客戶心態(tài)上。企業(yè)數(shù)據(jù)分析,中美在理念方面相差2-3年,而在實(shí)際執(zhí)行層面或許有5年左右的差距。此外,國內(nèi)的企業(yè)級(jí)客戶在進(jìn)行大數(shù)據(jù)分析時(shí),仍以分析結(jié)構(gòu)化數(shù)據(jù)為主,而對于內(nèi)涵豐富的非結(jié)構(gòu)化數(shù)據(jù),市面上并沒有有效的工具進(jìn)行分析。同時(shí),在進(jìn)行結(jié)構(gòu)化數(shù)據(jù)分析時(shí),仍采用了“招標(biāo)+外包”的傳統(tǒng)模式,即需要大數(shù)據(jù)分析服務(wù)的企業(yè)按照歷史經(jīng)驗(yàn)首先建立自己的數(shù)據(jù)分析KPI(關(guān)鍵績效指標(biāo)),然后將整個(gè)數(shù)據(jù)分析任務(wù)外包給第三方大數(shù)據(jù)公司,經(jīng)過數(shù)月的時(shí)間后,大數(shù)據(jù)公司將數(shù)據(jù)分析的結(jié)果返還給甲方企業(yè)。
美國有很多主流的企業(yè)已經(jīng)進(jìn)入到了以非結(jié)構(gòu)化數(shù)據(jù)分析以及數(shù)據(jù)驅(qū)動(dòng)、實(shí)時(shí)分析、人機(jī)互動(dòng)、結(jié)果易讀等為特點(diǎn)的數(shù)據(jù)分析的新紀(jì)元。但由于中國的大數(shù)據(jù)分析與應(yīng)用剛剛興起不過三至五年時(shí)間,人才比較匱乏,比如新浪微博就曾希望將1億的微博客戶進(jìn)行精準(zhǔn)分析與定位,但每天產(chǎn)出的近1億微博數(shù)據(jù)幾乎都是文本、圖片及視頻數(shù)據(jù),這些數(shù)據(jù)類型統(tǒng)稱為非結(jié)構(gòu)化數(shù)據(jù),也是目前大數(shù)據(jù)處理過程中的難點(diǎn)。其中尤其以非結(jié)構(gòu)化數(shù)據(jù)處理人才更是奇缺。
一個(gè)有意思的現(xiàn)象是,大型國際IT企業(yè)一般通過收購、戰(zhàn)略投資、合作等方式獲得非結(jié)構(gòu)化大數(shù)據(jù)的處理技術(shù)與人才,比如惠普(HPE)大數(shù)據(jù),通過開放60個(gè)API接口,以獲得部分處理文本、圖像、視頻的能力。相反,有一些小型的初創(chuàng)企業(yè),基于其對某個(gè)領(lǐng)域的深入研究,也在大數(shù)據(jù)的風(fēng)口博得快速成長。Taste Analytics這家總部位于美國的大數(shù)據(jù)高新科技公司,以強(qiáng)大的非結(jié)構(gòu)化數(shù)據(jù)分析能力和創(chuàng)新能力,便引起了筆者的注意。
說得這么玄乎,4V+1C看起來好復(fù)雜,其實(shí)大數(shù)據(jù)的本質(zhì)就是實(shí)現(xiàn)數(shù)據(jù)價(jià)值。
大數(shù)據(jù):體現(xiàn)應(yīng)用價(jià)值
當(dāng)前的大數(shù)據(jù)行業(yè),業(yè)界的關(guān)注重點(diǎn)已慢慢從基礎(chǔ)設(shè)施層,轉(zhuǎn)移到分析和應(yīng)用層面。大數(shù)據(jù)的價(jià)值,目前來看主要是應(yīng)用價(jià)值,沒有應(yīng)用價(jià)值或者不能幫助實(shí)現(xiàn)應(yīng)用價(jià)值一切都是空談。各大互聯(lián)網(wǎng)公司自身有很多研究大數(shù)據(jù)的專家,針對應(yīng)用本身進(jìn)行了很多研究。
Taste AnalyticsCEO汪曉宇
盡管都知道數(shù)據(jù)中蘊(yùn)含價(jià)值,但究竟如何洞察?Taste Analytics的CEO汪曉宇認(rèn)為大數(shù)據(jù)不是神話,不是數(shù)據(jù)科學(xué)家和大企業(yè)所獨(dú)有,“讓人們真正看見大數(shù)據(jù)分析的價(jià)值,同時(shí)讓大數(shù)據(jù)分析工具化,讓這個(gè)工具讓所有人使用,沒有應(yīng)用價(jià)值的大數(shù)據(jù)一切都是空談。”
如何讓大數(shù)據(jù)體現(xiàn)應(yīng)用價(jià)值?
如果說讓大數(shù)據(jù)體現(xiàn)應(yīng)用價(jià)值還屬于理念范疇,如何讓大數(shù)據(jù)分析工具化?讓這個(gè)工具為所有人使用,并最終讓大數(shù)據(jù)體現(xiàn)應(yīng)用價(jià)值則屬于工具與方法的范圍。Taste Analytics推出的Signals非結(jié)構(gòu)數(shù)據(jù)可視化分析平臺(tái)無疑是一個(gè)絕佳的方案。
Signals平臺(tái)具有實(shí)時(shí)動(dòng)態(tài)、圖像可視化、非結(jié)構(gòu)化數(shù)據(jù)分析能力等綜合智能數(shù)據(jù)分析能力,可用于對每一個(gè)企業(yè)日常經(jīng)營的實(shí)時(shí)智能數(shù)據(jù)進(jìn)行分析。其獨(dú)特在于強(qiáng)大的非結(jié)構(gòu)化文本文檔數(shù)據(jù)的深度分析能力,同時(shí)靈活的支撐著各種傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)(報(bào)表、銷售記錄等)。此外,Signals平臺(tái)具有廣泛的適用性,以人為本的設(shè)計(jì)理念,也方便了各個(gè)企業(yè)的管理和業(yè)務(wù)人員自由靈活地使用這個(gè)產(chǎn)品,目前可以成熟的分析包括中文在內(nèi)的12種文字、語音等非結(jié)構(gòu)化數(shù)據(jù)。
Signals平臺(tái)一共提供三層服務(wù):
第一層是數(shù)據(jù)采集層,它可以幫助企業(yè)更快更全的采集到各類第三方數(shù)據(jù)。目前已集成了上百個(gè)數(shù)據(jù)接口,包括亞馬遜、天貓、Salesforce,ZenDesk, Esty, Yelp、Twitter、Facebook、Apple Store、Google Play Store等,并且這個(gè)數(shù)字還在飛速擴(kuò)大。此外,為加強(qiáng)中國市場,Taste Analytics也正在和國內(nèi)知名的第三方數(shù)據(jù)提供商進(jìn)行合作,期望為中國客戶提供更多本地化的數(shù)據(jù);
第二層是數(shù)據(jù)分析層,用于對非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)進(jìn)行深度機(jī)器分析。Taste Analytics研發(fā)了“預(yù)測性分析”技術(shù),基于該技術(shù)運(yùn)用,用戶可以享受到結(jié)構(gòu)化和非結(jié)構(gòu)數(shù)據(jù)的精準(zhǔn)分析結(jié)果,并對市場行為做出及時(shí)預(yù)測;
第三層是圖像可視化層。Signals非結(jié)構(gòu)數(shù)據(jù)可視化分析平臺(tái)會(huì)把數(shù)據(jù)分析結(jié)果進(jìn)行可視化輸出,為客戶提供10余種圖像可視化模式,并且支持客戶自定義分析,將包括一共15種不同的可視化分類。Signals非結(jié)構(gòu)數(shù)據(jù)可視化分析平臺(tái)可根據(jù)用戶的不同喜好,繼續(xù)推出有價(jià)值的圖像展示,方便企業(yè)的使用。
通過上述三層服務(wù),Signals通過可視化分析結(jié)果和簡單易用的使用界面,幫助企業(yè)了解新的市場增長點(diǎn)、做出正確的決策,并可把分析能力推送給企業(yè)的決策層和領(lǐng)導(dǎo)層,以幫助企業(yè)做出決策。
實(shí)時(shí)交互是第五本質(zhì)屬性
大數(shù)據(jù)對于客戶應(yīng)用價(jià)值的體現(xiàn),還體現(xiàn)在“實(shí)時(shí)交互”上。汪曉宇說:“大數(shù)據(jù)時(shí)代推崇的是以用戶為中心、體驗(yàn)至上,這種體現(xiàn)建立在“實(shí)時(shí)交互”上。實(shí)時(shí)交互已經(jīng)逐漸成為大數(shù)據(jù)的第五項(xiàng)特征。”
因此,Taste Analytics研發(fā)的Signals非結(jié)構(gòu)數(shù)據(jù)可視化分析平臺(tái)具備成熟的實(shí)時(shí)分析包括中文在內(nèi)的12種文字以及語音等非結(jié)構(gòu)化數(shù)據(jù)的能力,同時(shí),具有強(qiáng)大的深度分析和預(yù)測能力。Signals通過深度學(xué)習(xí)非結(jié)構(gòu)化的自然語言,根據(jù)用戶的用詞、造句、行文方式來理解文字含義,通過對大范圍的用戶、上千萬個(gè)消費(fèi)點(diǎn)進(jìn)行聚類分析,打破傳統(tǒng)的輿情分析需要企業(yè)建立專有模型等問題的桎梏。Signals的服務(wù)適用于各種非結(jié)構(gòu)化數(shù)據(jù)分析場景,只要有聊天記錄、對話記錄和郵件記錄,就可以和數(shù)據(jù)源直接對接,易用而安全。Signals并通過數(shù)據(jù)分析結(jié)果的可視化輸出,為用戶提供10余種圖像可視化模式。用戶可根據(jù)企業(yè)內(nèi)部人員不同決策地位的需要和喜好,自定義分析結(jié)果,獲取對自己有價(jià)值的分析展示,方便了企業(yè)的管理和決策。
大數(shù)據(jù)價(jià)值探索 任重道遠(yuǎn)
從筆者觀察來看,大數(shù)據(jù)價(jià)值的探索與挖掘大家都在做著努力,從客戶層面,從梳理自身的需求出發(fā),倒推著技術(shù)的解決方案,從技術(shù)層面,從滿足客戶需求出發(fā),從技術(shù)上做著長遠(yuǎn)準(zhǔn)備。
Signals非結(jié)構(gòu)化數(shù)據(jù)可視化分析平臺(tái)以文本數(shù)據(jù)處理方面的獨(dú)樹一幟挑戰(zhàn)著非結(jié)構(gòu)化數(shù)據(jù)分析的難題,但顯然,它正在為大數(shù)據(jù)價(jià)值的探索做著超前的技術(shù)準(zhǔn)備,雖然,目前算不上“強(qiáng)大“,畢竟在圖像及視頻的處理方面還得繼續(xù)努力。但我們看到了Taste Analytics這個(gè)大數(shù)據(jù)公司的快速成長,2015年底,已經(jīng)完成了全部產(chǎn)品的中國本土化,包括產(chǎn)品使用中文化、云服務(wù)部署落地化、技術(shù)支持規(guī)?;?。并在2016年2月完成了由真格基金領(lǐng)投,聚合數(shù)據(jù)、華創(chuàng)資本跟投的A輪340萬美元的融資,而這一切都建立在300%的營收增長速度之上。
從Taste Analytics等大數(shù)據(jù)創(chuàng)業(yè)公司的成長,也從另一方面說明了大數(shù)據(jù)在未來所擁有的價(jià)值。但大數(shù)據(jù)價(jià)值的探索,其實(shí)還只是剛剛開始,無論是作為整個(gè)行業(yè)技術(shù)短板的圖像、視頻的處理技術(shù),還是用戶本身對需求的認(rèn)知與梳理,目前都還只是處于初級(jí)階段,大數(shù)據(jù)價(jià)值的探索,任重而道遠(yuǎn)!
來源:企業(yè)網(wǎng)
刷新相關(guān)文章
我要評論
活動(dòng)推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會(huì)2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
9#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會(huì)丨《云MSP發(fā)展白皮書》重