【視頻】《猿來“探”名企》之阿里小Ai之父閔萬里:大數據創(chuàng)新業(yè)務實踐
春夏 | 2016-06-29 15:55
【數據猿導讀】 阿里云小Ai之父——博士:“智能在端,智慧在云”;所有大數據服務都是為了滿足人的需求,人是一切數據的總和;大數據可以應用于電商行業(yè)、企業(yè)服務、影視娛樂、交通物流、GAS服務、三維建模等行業(yè)

來源:數據猿 記者:春夏
(《猿來“探”名企》之走進阿里巴巴)
上期《猿來“探”名企》之走進阿里巴巴欄目中,我們分享了阿里云四位(閔萬里、張洪倫、于軍、鄧彬)專家的精彩內容,得到了大家的廣泛關注與支持。為此,我們數據猿又為大家分別整理了四位專家分享的詳細內容。
今天,我們就為大家首先放送阿里云人工智能首席科學家、小Ai之父——山景(閔萬里)博士的精彩內容《大數據創(chuàng)新業(yè)務實踐》。
山景博士14歲被中科大少年班錄取。19歲畢業(yè)后赴美攻讀物理學碩士。2004年獲得芝加哥大學統(tǒng)計學博士學位。先后在IBM Watson研究院及 Google 擔任研究員,2013年加入阿里巴巴,領導阿里云人工智能項目小Ai。
(山景博士52分鐘完整分享視頻)
以下為山景博士分享的內容要點:
智能在端,智慧在云
首先我要解釋八個字:“智能在端,智慧在云”。智能是在端產生,而端上出來云的結果就是智慧。當所有數據匯集在云,智慧的交流、數據融合便沒有了成本,沒有成本的事物價值會產生“核聚變”式爆發(fā),就會產生智慧。
現在很多號稱是人工智能的產品并不是真正的智能。大家可能聽說有智能家電、智能家居,比如掃地機器人,把芯片放進去,就可以沿著路線走路。他們只是簡單的機器,毫無智能。我認為最接近人工智能的項目是無人駕駛,其具備人的所有功能:認知、視覺、聽覺以及實時判斷。
所以我著重強調“智能在端,智慧在云”,希望告訴大家什么是真正的智能,這也是我這幾年在淘寶、阿里云工作的深刻感受,我們團隊要做有智慧的產品,并且只做別人無法完成的事情,以凸顯差異化競爭的價值。
人是一切數據的總和
從幾千年的農耕社會到現在的信息時代,技術發(fā)生了很大的變革。首先是工業(yè)革命,然后有了半導體、芯片,接著出現了互聯網。當基礎設施硬件越來越強大的時候,硬件傳遞的數據就變得不可忽視了,因此,2004年開始,“大數據”這個詞逐漸進入人們的視野。目前,大數據金字塔還遠遠沒有到達頂部,我相信在未來很長一段時間內,大數據會換著各種外衣來沖擊我們的視聽和認知。
隨著數據的產生,大數據逐漸被應用,90年代就有數據處理了,當時有windows95。下面我舉幾個歷史上大數據應用的重大案例。
扎克伯格可以去白宮與奧巴馬討論政治話題,是因為其創(chuàng)辦的Facebook掌握了巨大數據,所以他知道現在的年輕人和選民關注什么,不滿什么,因此,即使他沒有受過任何政治訓練,他依然可以成為政治家。
奧巴馬也是靠大數據走上總統(tǒng)位置的,這也是大數據應用最經典的案例。2008年,奧巴馬聘請埃森哲總監(jiān)查看Facebook、Twitter的民意測驗數據,測算出加州地區(qū)哪些選民還在猶豫,然后雇人上門游說,借此登上了總統(tǒng)寶座,這是大數據改變政治版圖的案例。
大數據還可以完成政權交換。2011年阿拉伯、突尼斯、利比亞、埃及就是利用大數據精準鎖定對社會和總統(tǒng)不滿的人群,讓其在Facebook宣傳刺激性話題,不費一兵一卒便完成了政權交易。
這些事情的發(fā)生是因為大數據精準捕捉到了人內心的需求,然后為人提供服務。歸根結底,我們所做的所有大數據服務都是為了滿足人的需求,可以說,人是一切數據的總和。下面我們來看大數據是如何為人們的日常生活服務的。
大數據的創(chuàng)新實踐
電商行業(yè)
以淘寶為例,其購物首頁黃金位置的板塊可以產生很大銷量。因此,把淘寶10億商品中的哪類商品放到黃金位置可以產生最大價值就成為一個問題。以前我們會讓運營人員憑經驗判斷,而現在可以利用大數據做出選擇。
通過消費者的年齡、性別、職業(yè)、居住地、購物偏好等標簽,我們用模型計算出每個消費者看到一件黃金位置的物品時購買的概率,進而求出3億用戶購買的總概率,從而預測出此物品的銷售額。
每預測一件商品的銷售額都要計算3億人的購買概率,要對10億件商品的銷售額做出排序,加起來就是10億×3億的量級,我們的系統(tǒng)十幾分鐘就可以全部算完,從而選擇出哪些商品放到黃金位置可以產生最高銷量。
企業(yè)服務
阿里云可以通過企業(yè)公開的信息,利用爬蟲技術深度挖掘企業(yè)與企業(yè)的關系以及企業(yè)與個人的關系,進而構建企業(yè)全息畫像,包括企業(yè)背景、輿情、產品、投資狀況等行業(yè)動態(tài),從而應用到風險洞察、品牌營銷、產品預測以及潛客挖掘服務中。
首先舉個例子,中國的地王是誰?可能大家都會想到萬科。但我們通過數據挖掘發(fā)現其背后有中國五礦集團、中國石化集團、中國華能集團等一度關系,如果再扒二度關系,想象空間會無限延伸。
數據挖掘可以洞察企業(yè)風險。以杭州綠城集團為例,我們通過數據挖掘發(fā)現全息畫像圖出現黃標以提示情況異常,原因是與綠城集團合作的公司最近出現訴訟事件,并被濟南建筑勞務市場清除,而他與綠城集團又有合作關系,因此被我們的系統(tǒng)發(fā)現有輿論風險,并計算出其風險總分為0.577分。
用途在哪里?大家可以設想,如果放貸銀行想要了解申請貸款公司的狀況,就可以基于全息畫像圖評估與其關聯的上下游風險。申請貸款的公司不會主動告訴銀行其合作伙伴有問題,但數據可以告訴銀行具體的實際情況,還可以挖出源頭,而且每天都會更新。
除了能夠洞察企業(yè)的財務風險、司法風險、股權風險以外,還可以監(jiān)控品牌營銷。以支付寶為例,我們會監(jiān)測他的口碑傳播,所有關于支付寶的黑文、軟文等宣傳資料,系統(tǒng)都會進行實時抓拍。
產品預測也很簡單,比如我們要推出下一代云OS操作系統(tǒng),就可以通過系統(tǒng)引擎做輿情分析,預測消費者需要哪項功能以及不需要哪項功能,從而調整、優(yōu)化產品。
另外,系統(tǒng)還可以用于潛客挖掘。比如,對于谷歌公司來說,若在服務引擎中輸入對手“微軟”,就可以找出與微軟合作的所有客戶,然后定向挖角。而且還能知道自己的哪些客戶正在與微軟合作,處于高流失風險狀態(tài),進而采取補救措施。需要說明的是,這種業(yè)務往來是公開可查的信息,不是商業(yè)機密或內幕信息。
影視娛樂
今年《我是歌手》總決賽中,我們的小Ai在決賽現場全程預測了歌王的誕生,他在嘗試用非常理性的公式模擬理解感性的過程。通過歌手的演唱預測聽眾反應是非常復雜的邏輯關系,歌曲是否唱的好要取決于歌曲本身,也取決于歌手的現場發(fā)揮和聽眾的審美情趣,這是文化不可預測的,然而當我們數據足夠豐富時便可以預測,接下來看大數據如何在影視領域發(fā)揮價值的。
一,評估藝人商業(yè)價值。大數據系統(tǒng)可以通過粉絲成長指數、票房號召力指數、口碑指數等數據評估藝人知名度以及商業(yè)價值,從而幫助影視公司挑選合適的角色。我們的評估系統(tǒng)有真實的數據作為依據,并且已經應用到了阿里影業(yè)和阿里音樂業(yè)務當中。
二,影視投資風險控制。大數據可以從劇本題材、創(chuàng)作班底、競爭對手等維度預測電視劇、電影、IP系列作品的投資回報率。以IP作品為例,對于投資人來說,除了容易被搶走的知名IP作品以外,高性價比的黑馬作品也是其投資目標之一。這時就可以通過在線模型計算出每件作品會火的概率,從而找出容易火的黑馬作品。
交通物流
大數據還可以用于交通領域:我們用小Ai預測浙江省1300公里高速公路的交通路況,同時,我們選了國慶節(jié)假日最繁忙的時刻挑戰(zhàn)自己,每5分鐘更新一次未來60分鐘的路況,預測準確率達到91%。
以前有人想在新加坡、巴西做這件事,但因為計算量太大可能導致結果不準確,所以他們沒有如此大范圍的做。而我們依托于阿里的平臺能力以及大數據能力,就能在非常大數量范圍內達到高準確率。
通過預測交通路況,可以降低物流體系中同城貨運的成本。服務核心是通過信息透明化提升決策正確率,從而讓貨車司機接順風單、接力單和回程單。以前貨車司機使用百度地圖、谷歌地圖,看到的只是實時路況,不知道未經過的路況,所以不敢在途中多接單以免運貨遲到。但現在通過大數據對未來路況的預測,就能決定在哪段路中可以接順風單,不僅可以為貨車司機增加收入,為平臺節(jié)省人力成本,也能夠為消費者帶來更加快捷的服務。
相對于送貨來說,送外賣的時間窗口要求顯得更加嚴格,因為大家吃飯時間都集中在11:30——13:00或者18:00——20:00。而送餐小哥人數有限,只騎電動車最多能夠同時送5單,所以運力也極其有限,如果調配不合理,可能就會遲到兩個小時。
為此,我們制作了一套解決方案,并且在內外部都已經用過:在上海點餐的時間可以壓縮在45分鐘之內。因為我們對未來的路況掌握最精確,可以使用實時計算做全局優(yōu)化,從而為顧客帶來更快捷的送餐服務。以前大家可能花80分鐘都等不到外賣,現在花35分鐘就可以等到。
大數據預測路況還可以用于電商生態(tài)中。比如,雙11時淘寶銷量爆倉,大數據預測到義烏到南京方向的路線嚴重滯后,這時我們就會把預測結果告訴物流公司,讓其提前調撥運力,以保證客戶雙11購物后的收獲體驗。同時,大數據預測還可以使電商庫存降低22%,通過用戶在淘寶、天貓的購物行為數據實時計算出每個倉庫的銷量,從而降低庫存。
GAS服務
我們發(fā)現傳統(tǒng)領域有一個剛需:很多企業(yè)對空間位置的信息分布很敏感,而我們的GAS服務便可以為其解決問題。
以一手房營銷為例,售房人員若想找到行銷拓客的地點就要提前找到潛在購房客戶。因為我們有淘寶APP和高德APP,基于以上數據中消費者的標簽畫像以及人力密度就可以知道哪些人有購房意愿。比如一個用戶經常購買4—5歲孩子的玩具,可能是因為他有學齡前兒童,那么就會有購買學區(qū)房的意愿;另外一個用戶以前購物地址在南京,但是后來卻成了杭州,可能因為他換了工作地址,也需要買房。這些蛛絲馬跡就構成了用戶的購房意愿,如果這些用戶經常跑到銀泰城去,售房人員就可以去銀泰城做宣傳。
GAS服務還可以用于門店選址,通過績效考核、網格化分布等數據確定選址方案,其核心在于找到區(qū)域當中供給和需求之間的定量關系。
以我們?yōu)槲骱娮拥碾妱榆嚦潆姌哆x址為例,西湖電子有1500輛電動車,電動車充完電跑的歷程數有限,如果充電樁設置不合理,就需要跑到很遠的地方去充電,所以選址很重要。我們通過數據分析示意圖中紅點顯示的需求密度,確定充電樁的選址。另外,由于示意圖不僅會顯示當下充電的需求,還會顯示未來購買電動車的人群畫像,所以我們在解決當下充電需求的同時,還能夠預測未來上漲的需求。
三維建模
基于阿里云架構,我們還會將其用于三維建模服務。在消防、樓宇、樓堂館所、大壩等重要基礎設施的結構測量中,三維建模服務是剛需。以前會在房間內部放攝像頭,通過錄像進行三維重建,現在可以用激光掃描進行透視,然后針對波長反射情況重建三維立體模型,但其上傳電腦P圖時會占用很多內存,計算量很大。因此,我們用阿里云架構構建了一套服務,可以將任何上傳的數據進行三維渲染,解決三維建模問題。
阿里云的商業(yè)模式很簡單,我們要做行業(yè)中的領跑者,賦能給我們的伙伴客戶,并通過伙伴服務更多的終端用戶。我們要把火點起來,但星火燎原,要靠大家。
注:本文由數據猿記者春夏(微信:1101862984)整理發(fā)布。
來源:數據猿
我要評論
活動推薦more >
- 2018 上海國際大數據產業(yè)高2018-12-03
- 2018上海國際計算機網絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14