神策數(shù)據(jù)CEO桑文鋒:誰說大數(shù)據(jù)不需要「小而美」
桑文鋒 | 2016-08-04 15:59
【數(shù)據(jù)猿導讀】 從前任百度大數(shù)據(jù)部門的技術(shù)經(jīng)理,到今天神策數(shù)據(jù)CEO,9年時間,桑文鋒身上發(fā)生了許多變化。他笑稱,這種變化從他的微信好友數(shù)量就能看出來。創(chuàng)業(yè)之前,他只有200多個好友,現(xiàn)在已經(jīng)迅速逼近5000人的上限。大數(shù)據(jù)行業(yè)9年的歷程帶給他很多挑戰(zhàn),也改變了他的很多看法,但讓他對自己所選擇...

從前任百度大數(shù)據(jù)部門的技術(shù)經(jīng)理,到今天神策數(shù)據(jù)CEO,9年時間,桑文鋒身上發(fā)生了許多變化。他笑稱,這種變化從他的微信好友數(shù)量就能看出來。創(chuàng)業(yè)之前,他只有200多個好友,現(xiàn)在已經(jīng)迅速逼近5000人的上限。
大數(shù)據(jù)行業(yè)9年的歷程帶給他很多挑戰(zhàn),也改變了他的很多看法,但讓他對自己所選擇的道路愈加堅定了。前不久,神策數(shù)據(jù)拿到了400萬美元的A輪融資,桑文鋒與他團隊的堅持得到了認可。
近期,CDA約訪到了桑文鋒先生,聽他聊聊他對大數(shù)據(jù)行業(yè)的看法。
下文根據(jù)采訪實錄整理:
CDA:大數(shù)據(jù)領(lǐng)域的創(chuàng)業(yè)公司日漸增多,您怎么看待目前市場中的機遇和挑戰(zhàn)?
桑文鋒:我自2007年從浙江大學研究生畢業(yè)之后進入百度,一開始在百度知道做研發(fā)工作,第二年就開始做數(shù)據(jù)領(lǐng)域的工作。
百度推崇用數(shù)據(jù)說話,它本身的數(shù)據(jù)規(guī)模也比較大,懂數(shù)據(jù),對數(shù)據(jù)也比較重視。從2008年開始,我負責一個小團隊,基于Hadoop搭建了一些數(shù)據(jù)處理平臺,主要用來處理百度的產(chǎn)品數(shù)據(jù),比如它的用戶量、訪問量等等。
那個時候沒有大數(shù)據(jù)的概念,大家談論的都是云計算。到2011年、2012年左右,大數(shù)據(jù)的概念就比較火了,當時意識到大數(shù)據(jù)技術(shù)很有價值,但是數(shù)據(jù)基本都集中在BAT。
最近三四年業(yè)內(nèi)比較大,主要表現(xiàn)在:
一是移動互聯(lián)網(wǎng)的發(fā)展,傳感器的發(fā)展,讓以前收集不到的數(shù)據(jù)現(xiàn)在可以收集到了,線下的行為轉(zhuǎn)移到線上,這讓一些規(guī)模比較小的公司也能夠獲取數(shù)據(jù);
二是大數(shù)據(jù)處理的軟硬件基礎(chǔ)在不斷成熟,摩爾定律,機器越來越便宜,性能越來越高,像Hadoop這種基礎(chǔ)的大數(shù)據(jù)處理平臺越來越成熟,很容易搭建并使用;
三是,雖然前幾年大數(shù)據(jù)不乏炒作概念之嫌,但也有一點好處,就是提高了人們對于數(shù)據(jù)的重視程度,你不用再跟對方科普數(shù)據(jù)有多重要了,他已經(jīng)開始自覺地關(guān)注如何讓數(shù)據(jù)發(fā)揮更大的價值。
在這種大環(huán)境下,大數(shù)據(jù)技術(shù)能夠在很多領(lǐng)域被很多企業(yè)利用。而我最終出來創(chuàng)業(yè),其實賭了兩個潮流:一個是創(chuàng)業(yè)潮,國家鼓勵創(chuàng)業(yè),重視創(chuàng)業(yè),創(chuàng)業(yè)公司的數(shù)量不斷增多,代表著企業(yè)對于數(shù)據(jù)的潛在需求越來越大。另外一個是互聯(lián)網(wǎng)+,許多傳統(tǒng)企業(yè)面臨轉(zhuǎn)型,從線下轉(zhuǎn)到線上,轉(zhuǎn)型過程中必定也會產(chǎn)生數(shù)據(jù)的需求。吳軍在他的《浪潮之巔》中提到,科技領(lǐng)域的發(fā)展趨勢就是一波波浪潮,跟著浪潮走會更容易把事情做成。目前互聯(lián)網(wǎng)創(chuàng)業(yè)的浪潮能夠推動我們?nèi)グl(fā)現(xiàn)和把握時機。
CDA:什么樣的數(shù)據(jù)分析產(chǎn)品能在競爭中存活?
桑文鋒:數(shù)據(jù)分析不是一個新概念,早些年就已經(jīng)有不少公司在這個領(lǐng)域發(fā)力,覆蓋的用戶量也很高。目前市場上的部分數(shù)據(jù)分析產(chǎn)品有優(yōu)點,也存在著問題。好處在于一是簡單免費,不足的地方在于數(shù)據(jù)采集能力比較弱,一般只能采集客戶端的數(shù)據(jù),服務端、數(shù)據(jù)庫的數(shù)據(jù)不多,這就會影響后期的分析;第二點在分析能力,一般做宏觀分析都沒有問題,比較難實現(xiàn)的是多維度的交叉分析;第三點是數(shù)據(jù)安全,用戶會對數(shù)據(jù)存儲產(chǎn)生安全顧慮。
神策數(shù)據(jù)的定位是針對互聯(lián)網(wǎng)公司的用戶行為分析。有這么幾個特點:
第一,提供私有化部署,用戶可以把他需要的服務部署到自己的服務器上,數(shù)據(jù)不會出他自己的環(huán)境,打消了他們的安全顧慮。
第二,強調(diào)全端數(shù)據(jù)接入。不管是客戶端的數(shù)據(jù),還是服務端數(shù)據(jù)庫的數(shù)據(jù)都可以接入,提供可視化埋點、代碼埋點、工具導入等等,有了數(shù)據(jù)才能更好地分析。
第三,神策基于PaaS平臺,一般比較常用的是SaaS服務,二者的區(qū)別在于SaaS很難進行二次開發(fā)和深度利用,它不提供接口,你也很難建模,而用戶在PaaS平臺可以進行二次開發(fā)和存儲利用。從數(shù)據(jù)采集、存儲、建模分析到可視化,用PaaS平臺可以做到每一個環(huán)節(jié)對用戶開放,把數(shù)據(jù)讀取出來,進行深度利用。用Hadoop、Spark搭建的大數(shù)據(jù)框架也可以直接訪問。
另外,用戶的每一個行為就是一個事件,比如提交訂單,瀏覽網(wǎng)頁,可以理解為一系列事件。我們的平臺可以自定義用戶的事件以及事件相關(guān)的維度。要分析的產(chǎn)品各不相同,但事件的本質(zhì)是一樣的,我們有靈活的機制去適配。所以,所有的用戶只需要用同一個數(shù)據(jù)分析平臺就可以滿足需求,沒有太多定制化的東西,節(jié)省了很大成本。
大數(shù)據(jù)的概念很寬泛,專注于某一個領(lǐng)域更容易成功。比如我們專注于用戶行為分析,把這一個點做好就可以了,如果泛泛地什么都去嘗試,反而不能夠垂直深入。
2015年是大數(shù)據(jù)落地的一個年份,前兩年雖然有很多人在炒概念,但近期出現(xiàn)的數(shù)據(jù)公司都開始從某一個點切入,這是一種更務實更科學的方式。可能將來會出現(xiàn)行業(yè)的整合,但是目前那些小而精、小而美的產(chǎn)品存活下來的機會比較大。
很多人傾向于在現(xiàn)階段要掌握數(shù)據(jù),怎么能拿到數(shù)據(jù)怎么干,但我認為這種思路背離了以用戶為中心的理念。不能只想著自己掌握數(shù)據(jù),更重要的是要知道用戶真正需要什么。所以我認為大數(shù)據(jù)本身發(fā)展大概會分成兩個階段:第一個階段是能力階段,第二個階段是價值階段。現(xiàn)在大家知道數(shù)據(jù)很重要,但是不知道怎么做,你要提供好的數(shù)據(jù)分析工具,讓他有能力做,這是第一個階段。這個階段過后,工具普及了,人們更關(guān)注怎么從數(shù)據(jù)中挖掘更多的價值,這是第二個階段。
CDA:企業(yè)怎樣才能真正利用數(shù)據(jù)產(chǎn)生價值?
桑文鋒:不能把數(shù)據(jù)太神話了,一定要結(jié)合業(yè)務看待。我們最早從電商類的企業(yè)切入,因為對電商類的企業(yè)而言數(shù)據(jù)最關(guān)鍵,每一種商品的瀏覽情況、下單情況,用戶的轉(zhuǎn)化情況,每一種數(shù)據(jù)都直接與它的業(yè)務相關(guān)。在我們看來跟訂單與交易相關(guān)的數(shù)據(jù)價值會更明顯一些。比如,你去投放廣告,你去衡量在不同平臺投放廣告的效果如何,就要去對比不同渠道轉(zhuǎn)化的付費用戶的比例有多少,平均客單價有多高、復購情況如何,只有經(jīng)過這些分析,你才能知道不同廣告平臺的價值區(qū)別在哪里,就可以從拍腦袋的方式轉(zhuǎn)化到數(shù)據(jù)驅(qū)動的方式。
現(xiàn)階段對于創(chuàng)業(yè)公司來說,數(shù)據(jù)采集是比較難的。一方面是不知道怎么采集數(shù)據(jù),另一方面是不知道應該采集哪些數(shù)據(jù),更不知道怎樣把這些數(shù)據(jù)建模。所以我們一方面提供全端接入的模式,一方面也建立了數(shù)據(jù)分析團隊,幫助用戶理清思路,梳理維度,讓他們比較容易得落地;另外就是數(shù)據(jù)分析的理念問題,很多用戶不知道怎么做數(shù)據(jù)分析,那么我們在產(chǎn)品之外還需要灌輸理念,做一些科普的工作。這方面也是個坎,但是在過個三五年,數(shù)據(jù)驅(qū)動增長的理念應該就能夠更廣泛地被接受。
CDA:給想要投身這個行業(yè)的人留下一些建議吧
桑文鋒:大數(shù)據(jù)不是聽一兩次課或者看一兩本書就能摸清楚的,還是需要有實踐經(jīng)驗,比如說我之所以對大數(shù)據(jù)有信心,就是在百度的那幾年接觸過各種技術(shù),知道各種場景應該怎樣做處理,你本身要有機會去處理一些數(shù)據(jù)相關(guān)的問題。如果想做數(shù)據(jù)工程師,就以開發(fā)平臺架構(gòu)已出發(fā)點,多去尋找這樣的機會,對于分析師來說,則要首先培養(yǎng)自己數(shù)據(jù)驅(qū)動的理念,基于這種理念去做分析,自然能力就提升了。
對于大數(shù)據(jù)分析師這個崗位,我可以推薦一本書叫《精益數(shù)據(jù)分析》,主要講互聯(lián)網(wǎng)公司是如何做數(shù)據(jù)分析的。其實大數(shù)據(jù)分析的分析方法不難,難的是如何基于業(yè)務場景靈活運用,所以要先構(gòu)建理念。這本書在應用上可以給你一些啟發(fā)。也不要把自己局限于分析工作,多了解業(yè)務。
來源:CDA數(shù)據(jù)分析師
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重