創(chuàng)業(yè)半年公司估值4億,他的夢想是“人人都能成為AI科學(xué)家”
原創(chuàng) 小北 | 2018-05-16
【數(shù)據(jù)猿導(dǎo)讀】 中科院自動化所博士研究生,師從中國機器學(xué)習(xí)泰斗王玨;阿里合伙人劉振飛親自登門邀請加盟、“阿里十八羅漢”之一的吳泳銘給過一張自填薪資的offer;與張潼、吳恩達(dá)為百度同部門同事...這樣的夏粉,一創(chuàng)業(yè)就得到了資本市場的認(rèn)可,公司成立半年之內(nèi)迅速完成兩輪融資,估值達(dá)4億人民幣...

圖丨智鈾科技創(chuàng)始人、CEO及首席科學(xué)家 夏粉
來源:數(shù)據(jù)猿 記者:小北
目前,AI行業(yè)的發(fā)展已走過了最初的技術(shù)積累窗口期,進入到各方選手都在拼商用的深水區(qū),大家都開足馬力極力探索與行業(yè)深度耦合的商用之路。而另一邊的眾多傳統(tǒng)行業(yè)選手,也正如同垂垂老矣的遲暮英雄,急急地等著吮吸新鮮的血液以尋求新生。
但血液滴下來,他們卻遲遲接不住——高昂的技術(shù)門檻、AI人才的缺乏,AI與行業(yè)的融合都困難重重。
“能否用AI來訓(xùn)練AI,用算法來優(yōu)化算法,通過機器自動化學(xué)習(xí),來解決這一痛點呢?”夏粉告訴數(shù)據(jù)猿記者,其實早在百度任職期間,他就萌生了這一想法。如今,當(dāng)AI商用遇到瓶頸期之時,他立志要用自己的實際行動踐行,解決這一行業(yè)發(fā)展問題。之后,夏粉從百度離職,創(chuàng)立智鈾科技,公司僅僅成立半年,估值就達(dá)4億元人民幣。
夏粉,中科院自動化所機器學(xué)習(xí)博士,期間在機器學(xué)習(xí)頂級會議雜志JMLR,ICML, NIPS等發(fā)表多篇文章;2008年至2010年留校任復(fù)雜系統(tǒng)和智能科學(xué)實驗室助理研究員;2010年進入百度,先后任百度聯(lián)盟研發(fā)部廣告點擊率預(yù)估團隊技術(shù)負(fù)責(zé)人、百度研究院大數(shù)據(jù)實驗室超大規(guī)模機器學(xué)習(xí)團隊負(fù)責(zé)人、資深科學(xué)家(高校教授入職百度的級別);2017年6月創(chuàng)立智鈾科技,任CEO兼首席科學(xué)家。
看到如此資深的簡歷,大家一定沒想到,在大學(xué)中,他曾是同學(xué)眼中的“差生”。
01 當(dāng)初考5分的那個差生成了百度科學(xué)家
在大學(xué)同學(xué)十年聚會上,大家都說:“沒想到當(dāng)初線性代數(shù)只考了5分的夏粉,竟然成了科學(xué)家。”
從小學(xué)到高中,夏粉一直都是那個“不用太費力就能考第一”的別人家孩子,然而上了大學(xué),沉溺于游戲的他學(xué)業(yè)逐漸荒廢,在一次考試中線性代數(shù)竟然只考了5分,給大家留下了“差生”的印象。
但這個“差生”最終還是在本科的最后一年幡然醒悟,用三個月時間補齊所有課程,考上了中科院自動化所的研究生,開始當(dāng)時還算冷門的機器學(xué)習(xí)研究,師從機器學(xué)習(xí)泰斗王玨。
王玨,中國自動化研究所研究員、博士研究生導(dǎo)師,《自動化學(xué)報》編輯委員會顧問委員,原973項目首席科學(xué)家、中國自動化學(xué)會第四屆智能自動化專業(yè)委員會副主任、中國計算機學(xué)會人工智能與模式識別專業(yè)委員會副主任、主任,《自動化學(xué)報》副主編,復(fù)雜系統(tǒng)國家重點實驗室學(xué)術(shù)委員會委員。2014年12月3日,王玨先生因病醫(yī)治無效逝世,享年66歲。
到2008年夏粉博士畢業(yè)的時候,機器學(xué)習(xí)火苗初顯,BAT率先認(rèn)識到了其重要性。當(dāng)時,阿里副總裁劉振飛親自到中科院自動化所,邀請夏粉到杭州,“阿里十八羅漢”之一的吳泳銘還給了夏粉一張自填薪資的offer,“填了這個表,你就是阿里機器學(xué)習(xí)第一人了。”
但當(dāng)時,夏粉一心想留校繼續(xù)在學(xué)術(shù)上深造,沒有選擇做這個“第一人”。直到2010年,在學(xué)術(shù)上達(dá)到自己的目標(biāo)之后,夏粉想:“是時候讓理論應(yīng)用到實踐中去了”。
2010年5月,夏粉進入了具有濃厚工程師文化和不俗技術(shù)實力的百度,先后在百度聯(lián)盟研發(fā)部、大數(shù)據(jù)研究院任職。
在百度聯(lián)盟研發(fā)部期間,夏粉任廣告點擊率預(yù)估團隊負(fù)責(zé)人,主要集中于提升點擊率預(yù)估效果方面的工作。“當(dāng)時主要分為兩個方面,一是提升網(wǎng)絡(luò)廣告的CTR點擊率,二是在提升CTR的過程中,讓建模的代價變得最小。”因此,在數(shù)據(jù)特征、建模、調(diào)參上夏粉帶領(lǐng)團隊做了一系列研發(fā),在百度數(shù)據(jù)規(guī)模最大的廣告業(yè)務(wù)線——網(wǎng)盟,發(fā)展出了一套AutoML技術(shù)。
2013至2014年,張潼、吳恩達(dá)相繼加入百度研究院,其中張潼負(fù)責(zé)大數(shù)據(jù)實驗室。恰巧此時,夏粉也產(chǎn)生了新的想法,便找到張潼,告訴他自己想做一個機器學(xué)習(xí)的通用平臺,兩人一拍即合。這個產(chǎn)品就是后來的Pulsar,業(yè)界第一個基于萬億規(guī)模的深度學(xué)習(xí)網(wǎng)絡(luò)的機器學(xué)習(xí)平臺。Pulsar被百度各業(yè)務(wù)線廣泛使用,覆蓋公司絕大部分業(yè)務(wù)線,包括鳳巢、網(wǎng)盟、金融和糯米等,在百度所有內(nèi)部平臺中排名第一。
2017年,因戰(zhàn)略發(fā)展差異等問題,夏粉離開百度。“百度的AI重心在無人駕駛和DuerOS,而我一心想打造一款A(yù)utoML型通用產(chǎn)品”。
02 沒想到又成了企業(yè)家,公司成立半年就估值4億
2017年6月,智鈾科技成立。曾經(jīng)沒想到夏粉成為科學(xué)家的朋友們又沒料到,“怎么又成了企業(yè)家”?
夏粉告訴數(shù)據(jù)猿記者,從科學(xué)家到企業(yè)家的轉(zhuǎn)變,是因為他想讓人工智能的影響力擴散到更多領(lǐng)域。正如公司名“智鈾”:“智”為人工智能,“鈾”是一種能產(chǎn)生原子能的放射性元素,能夠核裂變散發(fā)出巨大的能量。
目前,智鈾科技已經(jīng)完成兩輪融資。Pre-A輪由洪泰基金領(lǐng)投,投后估值達(dá)4億人民幣。
成立半年就估值4億,夏粉認(rèn)為:“首先是Auto ML的賽道選擇,真正切中了行業(yè)痛點”。
業(yè)界存在這樣的共識,機器學(xué)習(xí)已經(jīng)成為大數(shù)據(jù)時代數(shù)據(jù)處理的基礎(chǔ)工具,是數(shù)據(jù)驅(qū)動公司標(biāo)配,然而,全世界只有極少數(shù)科學(xué)家能創(chuàng)建先進的機器學(xué)習(xí)模型,企業(yè)擁有適應(yīng)人工智能和機器學(xué)習(xí)高速發(fā)展所需的人才和資金預(yù)算也有限,因此,少數(shù)的資深機器學(xué)習(xí)科學(xué)家基本都在BAT這樣的一流互聯(lián)網(wǎng)公司中。其他大多數(shù)企業(yè),尤其是傳統(tǒng)領(lǐng)域的企業(yè)盡管擁有數(shù)據(jù),卻缺乏處理數(shù)據(jù)的人才和技術(shù),數(shù)據(jù)化、智能化之路異常艱難。
事實上,很多前沿科技公司都看到了這一痛點,去年5月,谷歌發(fā)布了Auto ML, 這一基于強化學(xué)習(xí)的算法(Reinforcement Learning Algorithms),先用一種控制器神經(jīng)網(wǎng)絡(luò)提議一個“子”模型架構(gòu),然后針對特定任務(wù)進行訓(xùn)練與質(zhì)量評估;而反饋給控制器的信息則會被用來改進下一輪提議。重復(fù)這個過程數(shù)千次生成新的架構(gòu),然后經(jīng)過測試和反饋,讓控制器進行學(xué)習(xí)。最終,控制器將學(xué)會為好的架構(gòu)分配高的概率,以便在延續(xù)的驗證數(shù)據(jù)集上實現(xiàn)更高的準(zhǔn)確性,并且對于架構(gòu)空間的差異很小。
與谷歌相比,智鈾科技開發(fā)的全自動機器學(xué)習(xí)平臺“EBRAIN”具備第四代機器學(xué)習(xí)能力,有以下幾個主要優(yōu)勢:
·數(shù)據(jù)量:千億樣本、千億特征
·模型:從淺層到深層靈活支持
·DNN:萬億鏈接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
·調(diào)研:自動化特征學(xué)習(xí)&參數(shù)調(diào)節(jié)
·時效性:模型在線更新
·評估:可視化模型&數(shù)據(jù)分析
在產(chǎn)品上,智鈾科技對標(biāo)谷歌,但從公司類型上,夏粉覺得智鈾更像DeepMind,“自動化學(xué)習(xí)本身涉及很多算法,需要很多優(yōu)秀的科學(xué)家,跟DeepMind一樣,我們致力于聚集國內(nèi)一流的AI科學(xué)家;其次,我們也是通過技術(shù)驅(qū)動研發(fā)自動化產(chǎn)品,再通過自動化促進產(chǎn)品化,最終服務(wù)到更多的人”。
其次是難以跨越的技術(shù)門檻:
自動化機器學(xué)習(xí)讓AI去訓(xùn)練AI,可謂AI之上的AI,是機器學(xué)習(xí)科學(xué)的最前沿。“這不僅需要有相當(dāng)強的技術(shù)實力,更需要在算法和實踐上有深厚的積累,能夠做到這一層的AI科學(xué)家寥寥無幾。”
夏粉具有超過15年的機器學(xué)習(xí)經(jīng)驗,在學(xué)術(shù)和工業(yè)界都有很深的積累,在擁有海量數(shù)據(jù)的互聯(lián)網(wǎng)場景實踐多年。智鈾科技團隊其他成員也都是來自于阿里、微軟的資深科學(xué)家。
“自動化機器化學(xué)習(xí)最難的是優(yōu)化問題。”夏粉告訴數(shù)據(jù)猿記者,“一個目標(biāo)函數(shù),需要找到一個點使目標(biāo)函數(shù)最小,對此有很多方法求解,但自動化機器學(xué)習(xí)中目標(biāo)函數(shù)不可導(dǎo),反饋機制不明確,計算復(fù)雜度高,所以要全部試一遍,成本非常高。把不可導(dǎo)變成可導(dǎo)的優(yōu)化問題出來,就要求近似”。
人工智能打敗國際象棋大師是在上世紀(jì)80年代,通過暴力搜索對每一步棋都進行評估,選取分?jǐn)?shù)最好的一步。但是到圍棋,因為復(fù)雜度太高,窮搜搜索不出來,所以要做近似問題,把不可解問題近似成可解的問題,找目標(biāo)函數(shù),使目標(biāo)函數(shù)以很大的概率覆蓋每個解,同時求解的復(fù)雜度降低。
智鈾科技在以上方面創(chuàng)新了很多算法(人和機器都沒有辦法找最優(yōu)解,機器范圍大、效率高,所以效果比人好),以前象棋每步搜索2億次,現(xiàn)在只需要做3000萬次,因為做了優(yōu)化。目前,智鈾科技已經(jīng)為金融、醫(yī)療、物聯(lián)網(wǎng)等多個行業(yè)的公司提供服務(wù),產(chǎn)品的應(yīng)用場景涵蓋點擊率預(yù)估、反欺詐偵測、市場精準(zhǔn)營銷以及個性化推薦等。
以內(nèi)容推薦應(yīng)用為例,醫(yī)藥公司會通過微信、郵件等方式為醫(yī)生推送內(nèi)容(即文章), 推送后醫(yī)生會對文章有閱讀或點贊行為?,F(xiàn)在需要根據(jù)醫(yī)生的特征和歷史閱讀、點贊記錄預(yù)測其感興趣的內(nèi)容,從而進行內(nèi)容的精準(zhǔn)推薦。
常規(guī)的做法是:對醫(yī)生和文本提取大量特征,進行特征選擇和變換,選擇合適算法和對應(yīng)的超參數(shù),訓(xùn)練模型。通過在驗證集上效果,挑選最優(yōu)的特征、算法和超參數(shù)。所有的選擇過程由人工完成,耗費大量人力和計算資源。
對此,智鈾在文本結(jié)構(gòu)化處理的基礎(chǔ)上,利用云計算提供的大量計算能力,通過EBRAIN在很短的時間內(nèi)自動構(gòu)建客戶興趣模型,并提供內(nèi)容推薦核心服務(wù)能力。最終,根據(jù)醫(yī)生的興趣進行信息推薦,按照行業(yè)標(biāo)準(zhǔn)預(yù)估客戶內(nèi)容訪問量提升50%以上。
Auto ML幫助普通工程師提高生產(chǎn)力,也幫助傳統(tǒng)企業(yè)更快速地?fù)肀I。但這并不是夏粉的終極目標(biāo),“智鈾科技未來的愿景是讓人人都能用上AI。正如互聯(lián)網(wǎng)科技滲透到人們生活的方方面面一樣,AI也終將從高端走向大眾。就像美圖秀秀讓沒有PS基礎(chǔ)的人也能隨意地切換濾鏡、調(diào)整色彩;Windows讓沒有計算機基礎(chǔ)的人也能操作電腦;傻瓜相機讓不懂?dāng)z影的人也能拍照一樣。”(文/小北)
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新