大數(shù)據(jù)專家周濤:其實我們一直徘徊在大數(shù)據(jù)門口
【數(shù)據(jù)猿導(dǎo)讀】 對于中國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,周濤是非常冷靜和客觀的。他對中國大數(shù)據(jù)產(chǎn)業(yè)的整體發(fā)展態(tài)勢和現(xiàn)狀進行了總結(jié)性陳述。在他看來,中國依然在大數(shù)據(jù)時代的門口徘徊。他表示:影響大數(shù)據(jù)的三個主要創(chuàng)新要素是原始數(shù)據(jù)、觀念和技術(shù)及領(lǐng)先人。所以他們一直在致力于在建立一個好的生態(tài),讓這三個因素...

我們談了很多大數(shù)據(jù)的文化,但是有一個問題,我們要回想一下,我們真正的大數(shù)據(jù)時代到底有沒有來?我看到我們嘉賓有一個演講,叫做《未來已來》,但是,另外一種大數(shù)據(jù)正在徘徊在某一個關(guān)口,好像沒來。
我曾經(jīng)問過很多投資人,包括政府里面特別支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的人,問他們能不能講出他們身邊發(fā)生的大數(shù)據(jù)的故事。他們有的人想了很久講不出來,或者只是從以前的書里面摘出了一些國外的例子。
在我看來其實我們一直徘徊在大數(shù)據(jù)門口,并沒有真正進入到大數(shù)據(jù)時代。首先總體上來講,我們沒有哪些產(chǎn)品帶給我們社會價值,而且是典型的大數(shù)據(jù)產(chǎn)品。其次,在很多我們覺得似乎運用大數(shù)據(jù)帶來革命化行業(yè)好像大數(shù)據(jù)也沒有幫助他們實現(xiàn)真正的轉(zhuǎn)型升級。第三,我們看到國家電視臺出現(xiàn)了很多數(shù)據(jù)統(tǒng)計的影子,但是大數(shù)據(jù)其實并沒有幫助國家做出什么重大決策,沒有起到真正的支撐作用。
為什么我們還沒有用到呢?我覺得是影響大數(shù)據(jù)的三個主要創(chuàng)新要素,他們之間是分離的。第一是原始數(shù)據(jù);第二是觀念和技術(shù);第三是領(lǐng)先人。所以我們一直是致力于建立一個好的生態(tài),在這三方面同時融合。
首先從技術(shù)上來講。我們都知道谷歌口號要把機器學(xué)習(xí)能力開拓出去,我有一個師兄,他是科大訊飛的。他曾經(jīng)跟我聊科大訊飛,給我聊他們開放的是一個學(xué)習(xí)結(jié)果。但是我想說的是把學(xué)習(xí)過程和中間數(shù)據(jù)挖掘能力開發(fā)出去,讓我們從數(shù)據(jù)價值走到結(jié)果做出來。每一模塊可能是一個梯度的決策樹,可能是一個神經(jīng)網(wǎng)絡(luò),他只需要拖拉這個模塊就行了,不需要再進行內(nèi)部編程,這就使得一家企業(yè)使用數(shù)據(jù)挖掘能力大幅度下降,沒有門檻。這樣每一家企業(yè)都能非常好使用數(shù)據(jù)挖掘。
這是我們在富士康做的例子。這個問題可以做幾百上千個模型,智能制造。當(dāng)我們清洗完數(shù)據(jù)獲得特征以后,在編寫這個機器學(xué)習(xí)模型的時候我們只需要兩三個小時完成。我們可以把以前的80%的監(jiān)測精度提高,同時我們可以給到銀行什么是高凈值用戶,我們可以在一天內(nèi)拼好我們的服務(wù)方案。
除了這個以外,我們講了第二點我們希望有好的平臺,能夠把人才聚集起來。我們剛才講怎么樣聚集技術(shù)門檻,讓技術(shù)走進千家萬戶。我們做了第二個叫做Data Castle,這個平臺在高新區(qū),我們把它叫做數(shù)據(jù)城堡。我們的目的是三年以后有100萬,或者100萬以上,數(shù)據(jù)在他數(shù)據(jù)工程里面。我們辦大型比賽,這個比賽主要分兩大類,第一類是算法性,就是數(shù)據(jù)挖掘問題,我們給出數(shù)據(jù),你隨時可以看到實時排名。
第二創(chuàng)業(yè)類比賽,我們會開放一些你不可能得到的數(shù)據(jù)。舉一個例子,我們最近正在上線比賽,把整個中國60年氣象數(shù)據(jù)全部開放,這在歷史上是沒有的,你只要上這個平臺就能下載到。有了這個數(shù)據(jù)你提交一個商業(yè)計劃書,告訴我你怎么用這個數(shù)據(jù)。勝出者可以得到三樣?xùn)|西,一可以獲得一大筆獎金,二可以獲得一大筆投資,三他可以進駐國家氣象局,獲得更精細數(shù)據(jù),這些數(shù)據(jù)除了氣象局拿到只有我們拿得到,因為我們代表國家發(fā)改委來做這項開發(fā)。這是通過市面上不可能獲得數(shù)據(jù)。你們可以在比賽中找到先機,但前提是你們必須是非常好的團隊。第三,我們給業(yè)協(xié)同志一些原創(chuàng)的內(nèi)容,既包括科學(xué)研究的內(nèi)容,也包括一些大V的微信、視頻和文章,通過我們這個平臺在不同階段可以獲得學(xué)習(xí)機會。
到目前為止我們大概有3萬多人,這3萬多人還不僅僅是愛好者,一些狂熱者。我們前期做了全國競賽,這3萬多人來自全球1千多所高校,覆蓋了北美,在北美覆蓋了172所高校,大陸有2千多所。同時來自于不同企業(yè),包括科學(xué)院、微軟、阿里、1號店、京東等等。通過這個比賽我們可以甄別出來哪些人適合做什么事,因為這里面競賽既有做廣告預(yù)測的,我們也能做圖象驗證碼識別,我們其能夠處理語音網(wǎng)絡(luò)等等數(shù)據(jù)。
所以做了這些比賽的人,我們其實不僅是通過比賽訓(xùn)練一個人各方面的數(shù)據(jù)挖掘能力,反過來來講我們了解中間每一個人他在哪些數(shù)據(jù)處理當(dāng)中是比較擅長的。
有了這個比賽以后,我們同時也可以做兩件事,一個是提供給企業(yè)一個非常好宣傳品牌機會,同時給他招募到人。我舉一個例子,比如我一個朋友在汽車之家做CEO,他們光是在我們QQ群里面叫了一聲,說有沒有人到汽車之家來,我們當(dāng)天就收到三四百個簡歷。與此同時在上面比賽,你迅速可以讓幾萬個數(shù)據(jù)挖掘狂熱者了解了你的品牌,知道你這個公司是做大數(shù)據(jù)的。反過來講,我們給數(shù)據(jù)挖掘者提供了渠道,讓他們正到自己更心穎的企業(yè)。
我們原來在百分點科技,做過廣告,做過氣象,做到醫(yī)療和教育,我們不管做什么,我們都比企業(yè)原有結(jié)果明顯提高很高。說明這些人對企業(yè)帶來了真正的幫助。
我們也做了數(shù)據(jù)的流通,希望數(shù)據(jù)流通產(chǎn)生價值。數(shù)據(jù)流通創(chuàng)造價值開放和交易。流通過程當(dāng)中涉及到要用錢或者用數(shù)據(jù)。為了做這件事情我們要提前做好四件事。第一件事情我們需要整理合法可流通數(shù)據(jù)目錄。第二件事情我們需要建立一個平臺。你進到這個平臺能夠很容易搜索到你想要數(shù)據(jù)并且?guī)椭阗徺I,這個平臺最終成為交易,使得買家能夠買得到數(shù)據(jù),賣家更好的把數(shù)據(jù)賣出去。第三件事情,我們需要去了解整個數(shù)據(jù)版權(quán)。一個數(shù)據(jù)跟一個杯子不一樣,杯子賣了就沒有了,但是你賣了這個數(shù)據(jù),這個數(shù)據(jù)你還可以賣。為了解決這個事情光靠立法不行,我們利用技術(shù)手段,使得數(shù)據(jù)沒法再拷貝出去。第四件事情我怎么給數(shù)據(jù)定價。大家看桌上有一瓶怡保礦泉水,對于這種零售品我們對他們的價格很敏銳,我們也知道哪里能買到,但是數(shù)據(jù)不一樣。比如成都一年出租車GPS數(shù)據(jù)有270億,我們不知道這些數(shù)據(jù)能賣不能賣,如果要賣,到底賣多少錢,是一千萬,一百萬還是十萬,不清楚,所以需要一個好的辦法,跟一個精度事務(wù)所,去探索怎么樣給數(shù)據(jù)定價。通過給數(shù)據(jù)定價我們實現(xiàn)兩件事情,第一我們讓數(shù)據(jù)寫進企業(yè)三張表里,第二我們讓數(shù)據(jù)能夠作為產(chǎn)權(quán)作為股本金投到一家創(chuàng)新企業(yè),如果這樣能夠成型,意味著中國幾排上千萬的數(shù)據(jù)會進一步衍生延伸的數(shù)據(jù)。
只有把這四件事情都做好,才能真正去探尋一個非常好的數(shù)據(jù)流通模型。
數(shù)據(jù)驅(qū)動創(chuàng)新,創(chuàng)新驅(qū)動發(fā)展。這個是模型是我們一針一線來做的,圍繞著這些要解決數(shù)據(jù)流通的問題。我們還做四類平臺,一類是社區(qū)挖掘品牌,一類是做大數(shù)據(jù)頂層設(shè)計與咨詢,一類是做數(shù)據(jù)人才匯聚,一類是做數(shù)據(jù)安全。我們會了解每一份敏感數(shù)據(jù),包括下載、拷貝、處理都會做數(shù)據(jù)記錄,并且立刻打上水印,所以任何敏感數(shù)據(jù)泄漏都能反向追查到到底是哪個人,從哪個地方,哪臺設(shè)備,通過什么權(quán)限流通出去的。
最外面這一層是整個體系做數(shù)據(jù)垂直方向。簡單給大家說一下各自特點。醫(yī)療健康方面有做設(shè)備,我們現(xiàn)在管理了11萬臺設(shè)備,我們現(xiàn)在已經(jīng)成為全國第2大設(shè)備管理商,預(yù)計明年9月份我們會管理100萬臺設(shè)備,所以整個未來醫(yī)療設(shè)備我們可以通過第一步通過管理收費,第二個可以切入到配件和維修市場,因為我們知道哪個設(shè)備的維修率和返修率,我們也可以通過買國產(chǎn)的,比如說幾億的小公司可以整體賣掉,做醫(yī)療化一體服務(wù)。另外做教育的,從幼兒園,也做人力資源招聘和管理。
我們每一個方向有一到兩家垂直企業(yè),內(nèi)部有核心品牌和數(shù)據(jù)流通管控部門,能夠?qū)崿F(xiàn)整個數(shù)據(jù)的壟斷,往下發(fā)展切入到數(shù)據(jù)創(chuàng)新基礎(chǔ)設(shè)施。
這是我們整體情況介紹,我們團隊這么多年一直致力于大數(shù)據(jù)生態(tài)建設(shè),我們自己通過嘗試,看這個生態(tài)當(dāng)中存在的問題。
來源:數(shù)據(jù)分析網(wǎng)
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重