第四范式的聯(lián)合創(chuàng)始人陳雨強(qiáng):讓人工智能變成所有人都可以獲得的能力
Evelyn 杜 | 2017-05-24 15:04
【數(shù)據(jù)猿導(dǎo)讀】 過去,我們并沒有真正的達(dá)到人工智能,其實(shí)達(dá)到的是人工的智能。在實(shí)現(xiàn)真正人工智能方面,目前,我們?nèi)〉昧苏Z音、圖像和藝術(shù)領(lǐng)域的幾個突破。人工智能帶來的紅利只能被很少一部分人所獲得將會非??膳?

人工智能到底可不可怕?人工智能到底是把人類帶到了更大的繁榮,還是更大的毀滅?相信這是不少人關(guān)心的問題。在5月20日的MTA天漠音樂節(jié)科技論壇上,第四范式的聯(lián)合創(chuàng)始人、首席研究科學(xué)家陳雨強(qiáng)發(fā)表了有關(guān)人工智能的演講。
在陳雨強(qiáng)看來,過去,我們并沒有真正的達(dá)到人工智能,其實(shí)達(dá)到的是人工的智能。在實(shí)現(xiàn)真正人工智能方面,目前,我們?nèi)〉昧苏Z音、圖像和藝術(shù)領(lǐng)域的幾個突破。
陳雨強(qiáng)認(rèn)為,之所以能夠有這么多相對成功的人工智能的應(yīng)用,主要是靠大數(shù)據(jù)和機(jī)器學(xué)習(xí)。目前,我們正在面臨一場智能革命,一定會出現(xiàn)一些數(shù)據(jù)的寡頭、數(shù)據(jù)的資本家,人工智能帶來的紅利只能被很少一部分人所獲得將會非常可怕。
因此,陳雨強(qiáng)認(rèn)為,我們應(yīng)該做的事情是要讓人工智能變成所有人都可以獲得的一個能力。
以下為演講實(shí)錄
大家下午好!我是第四范式的陳雨強(qiáng)。今天我要給大家?guī)淼姆窒碇黝}是 AI for everyone,讓所有人都能用上的人工智能。
人工智能到底是把人類帶到了更大的繁榮,還是更大的毀滅?人工智能是讓每個人更開心還是更煩擾?相信這是大家所關(guān)心的問題。
其實(shí)人工智能發(fā)展最早從50年代阿蘭·麥席森·圖靈發(fā)明第一臺計算機(jī)開始的,當(dāng)時他提出了一個著名的圖靈測試。這個測試是判別機(jī)器是否具備智能功能。
在一開始的時候,科學(xué)家們非常的樂觀。5、60年代的時候,科學(xué)家提出了一個仿腦的神經(jīng)網(wǎng)絡(luò)技術(shù)??梢越鉀Q非常多曾經(jīng)想都不能想的一些問題,科學(xué)家們非常的興奮。
當(dāng)時就說,可能在3到5年之內(nèi),人工智能就能達(dá)到人類的智能平均水平。其實(shí),我們現(xiàn)在來看,人工智能還沒有達(dá)到汪星人、喵星人的水平。
既然不能達(dá)到,我們就讓專家去教機(jī)器什么叫智能?當(dāng)時有一個專家系統(tǒng)的技術(shù),是把專家的知識變成機(jī)器可以讀取的知識,同時,告訴機(jī)器如何進(jìn)行推理。
這個問題在什么地方?它不知道變通,專家教你是一就是一,教你是二就是二,沒有變通能力,這就不是人工智能,而是人工的智能??偨Y(jié)一下,在過去來說,我們并沒有真正的達(dá)到人工智能,其實(shí)達(dá)到的是人工的智能。
怎么樣達(dá)到真正的人工智能?看看我們現(xiàn)在最新的一些進(jìn)展,也跟大家分享一下。
這是微軟2012年發(fā)布的同聲傳譯的技術(shù),非常有意思。這個技術(shù)不僅能在會場上同時把英文傳譯成中文,有一點(diǎn)特別有意思的是,他還可以模仿你的音色。你可能非常想聽特朗普說中文是什么樣的感覺,你可能也特別想聽小沈陽用英語講段子是什么樣的感覺。這樣的技術(shù)就可以達(dá)到這樣的水平,這是語音上的進(jìn)展。
視覺上我們也有一個非常大的突破。在過去5到7年時間內(nèi),計算機(jī)視覺有一個非常長足的發(fā)展,物體識別的錯誤率從過去的28%下降到現(xiàn)在的3%不到。這個背后的技術(shù)是什么?是機(jī)器訓(xùn)練了上千萬,甚至是上億的圖片,這點(diǎn)與人的學(xué)習(xí)很類似。
大家在小時候的時候,從出生一開始就會到處張望,對世界充滿著好奇,每時每刻都在捕捉著新的圖片,每時每刻父母都會告訴你這是什么,那是什么。
除了在語音圖像上,甚至可以在藝術(shù)領(lǐng)域發(fā)揮作用。可以給一個梵高的畫,然后再給一張其他的圖片,把它變成梵高風(fēng)格的圖片,無論是風(fēng)景還是人像。這是一個非常有意思的事情。機(jī)器不再是一個完全沒有情感的,它也可以做一些藝術(shù)的事情。但機(jī)器的藝術(shù)和人的藝術(shù)還不是同樣的方式。
總結(jié)一下,為什么說現(xiàn)在有了這么多相對成功的人工智能的應(yīng)用呢?現(xiàn)在的人工智能是基于機(jī)器學(xué)習(xí)+大數(shù)據(jù)。阿爾法狗打敗李世石是因?yàn)楹竺嬗幸粋€30萬棋譜的網(wǎng)上對戰(zhàn)平臺。
除了人工智能必不可少的大數(shù)據(jù)之外,我們必須還要有機(jī)器學(xué)習(xí)的模型等技術(shù),這可能就包括一些深度學(xué)習(xí)模型、合函數(shù)。
回到最開始的問題,機(jī)器學(xué)習(xí)能否服務(wù)于我們在座的所有人,能否讓所有人都能在中獲益?你要想的就是你有沒有大數(shù)據(jù),你懂不懂機(jī)器學(xué)習(xí)?
這對大家來說是困難的,因?yàn)槲抑挥形易约旱臄?shù)據(jù),我沒有別人的數(shù)據(jù),如果我不是科班出生,我就不是那么了解數(shù)學(xué),我也不知道該如何做機(jī)器學(xué)習(xí)。我們第四范式希望做的事情是把這個邊界往前走一步,希望所有人都能用上人工智能。
從兩個角度上來解決這個問題:首先,是機(jī)器學(xué)習(xí)的問題。第四范式設(shè)計了一個機(jī)器學(xué)習(xí)平臺,這是讓所有人都可以建模,把我們的數(shù)據(jù)、模型、上線的過程變成一個可視化的方式進(jìn)行建模,通過這種方式我們可以讓一個沒有經(jīng)過特別多機(jī)器學(xué)習(xí)訓(xùn)練的人很快的上手機(jī)器學(xué)習(xí),用上機(jī)器學(xué)習(xí),用上最新的算法。
大家還是不知道這個可以干什么?舉個實(shí)際的例子。去年年末,我們組織了一個建模大賽(機(jī)器學(xué)習(xí)建模大賽),這是全球首個面向非專業(yè)人士的機(jī)器學(xué)習(xí)建模大賽。“非專業(yè)”到什么程度呢?不允許有機(jī)器學(xué)習(xí)背景的人參加,參加的人都是我們公司的行政、人事、市場、銷售這樣的人員。
我們會發(fā)現(xiàn)一個非常驚訝的結(jié)果,業(yè)務(wù)人員建出來的模型和我們專業(yè)的工程師科學(xué)家團(tuán)隊(duì)(有3到5年專業(yè)培訓(xùn)的科學(xué)家)建出來的模型,有差不多的效果。“先知”封裝了機(jī)器學(xué)習(xí)底層的算法、計算資源、閉環(huán)等,讓所有人都可以建模,你也可以,他也可以,我也可以。
在這個基礎(chǔ)上,我們繼續(xù)更進(jìn)了一步,我們做了一個“范式大學(xué)”的項(xiàng)目,我們希望沒有機(jī)器學(xué)習(xí)背景的人可以越來越多的參與進(jìn)來。“范式大學(xué)”通過培養(yǎng)非專業(yè)人士利用“先知”建模,“批量生產(chǎn)”數(shù)據(jù)科學(xué)家,進(jìn)一步解決AI人才高門檻的問題。第一期畢業(yè)生經(jīng)過了一個月的培訓(xùn),我們發(fā)現(xiàn),他們已經(jīng)擁有非常專業(yè)的建模能力,可以做一些非常好的建模應(yīng)用。
此外,人工智能還面臨數(shù)據(jù)量不足的問題??纯从萌斯ぶ悄艹晒Φ墓荆确秸f谷歌、百度。這些公司擁有的一個共性是,他們擁有大數(shù)據(jù)。
對比18世紀(jì)的工業(yè)革命對世界造成的影響,當(dāng)時蒸汽機(jī)這樣的技術(shù)發(fā)明,讓整個世界發(fā)生翻天覆地的變化。但是蒸汽機(jī)這個技術(shù)的發(fā)明,導(dǎo)致了我們出現(xiàn)了一批資本家,這些資本家擁有了這些技術(shù)、擁有了生產(chǎn)資料,同時就擁有了巨額資本,這樣就會產(chǎn)生金融寡頭,我們不希望將來的財富永遠(yuǎn)只集中在金融寡頭身上,我們希望所有人都可以平等的擁有財富。
現(xiàn)在我們正在面臨一場智能的革命,在這里面我們會發(fā)現(xiàn),它一定會出現(xiàn)一些數(shù)據(jù)的寡頭、數(shù)據(jù)的資本家。它現(xiàn)在擁有好的業(yè)務(wù),就會擁有更多的用戶及用戶數(shù)據(jù),這樣他就會壟斷數(shù)據(jù),從而壟斷人工智能,這是一件非常可怕的事情。
我們不希望這樣的事情發(fā)生。如何可以阻止?我們也在想一個新的技術(shù),叫遷移學(xué)習(xí)。簡單說,就是一個舉一反三的能力,就是說你學(xué)習(xí)的英文,你就可以學(xué)法語,有了舉一反三的能力,你就不需要更多的數(shù)據(jù)。
我們有一個做電影的網(wǎng)站,這就是國外的豆瓣,如果你在上面有很多的行為,但在亞馬遜上沒有購買行為,你也可以用這個數(shù)據(jù)幫助你做更好的預(yù)測,來判斷是否會在亞馬遜上做購物。
除了剛才的應(yīng)用還有其他的應(yīng)用,比如文本的數(shù)據(jù)比圖片的數(shù)據(jù)多,無論是互聯(lián)網(wǎng)上還是離線的應(yīng)用上。我們也可以試圖用文本的數(shù)據(jù)來幫助我們進(jìn)行圖片方面的訓(xùn)練。通過文本的數(shù)據(jù),加上一些很少的圖片去進(jìn)行圖片分類。
我們發(fā)現(xiàn)這件事確實(shí)可以。用100張圖片訓(xùn)練的模型,和200頁書訓(xùn)練的模型的效果差不多。我們轉(zhuǎn)化了一下,這就跟中國的古話差不多,叫一圖勝千言。
谷歌也在嘗試,在游戲上,使用遷移學(xué)習(xí)的技術(shù),讓機(jī)器變成游戲達(dá)人,什么意思?不僅玩一款游戲是達(dá)人,可以將模型遷移到別的游戲上,你玩所有游戲都是達(dá)人。
除了實(shí)驗(yàn)室的成果之外,“遷移學(xué)習(xí)”在工業(yè)界的實(shí)際應(yīng)用上也有非常多的用途,比如說第四范式遷移學(xué)習(xí)幫助銀行做汽車分期的推薦。
汽車分期這類大額的業(yè)務(wù),銀行在這方面的數(shù)據(jù)是非常少的,于是我們成功用小額信貸的數(shù)據(jù)幫助大額的信貸,最后達(dá)到效果的提升,這背后就使用了遷移學(xué)習(xí)。遷移學(xué)習(xí)可以幫助大家做到一個高頻打低頻的事情,用數(shù)據(jù)非常多的業(yè)務(wù)幫助數(shù)據(jù)非常少的業(yè)務(wù)來進(jìn)行提升,從而打破寡頭對數(shù)據(jù)的壟斷。
回到最開始的問題,人工智能這件事是否可怕?我們認(rèn)為無論是強(qiáng)人工智能,還是超級人工智能,其實(shí)并不可怕,可怕的是人工智能帶來的紅利只能被很少一部分人所獲得。汽車的發(fā)明讓所有人都不用走路了,但是人工智能的發(fā)明是否可以讓所有人獲益?
第四范式覺得,我們應(yīng)該做的事情是要讓人工智能這件事變成所有人都可以獲得的一個能力。就像《獅子王》里的一樣,我們不希望人工智能被刀巴這樣的獅子所主宰,不希望它被壟斷,而是希望所有人都可以用上人工智能。第四范式希望隨著大數(shù)據(jù)和機(jī)器學(xué)習(xí)門檻的不斷降低,讓AI不再是少數(shù)人的“特權(quán)”,讓每個人都能享受到人工智能紅利。
這是我今天的分享,謝謝大家!
來源:36kr
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新