香港科技大學(xué)教授楊強:人工智能需要大數(shù)據(jù),遷移學(xué)習(xí)能讓人人都享受人工智能的紅利
楊強 | 2016-05-23 11:43
【數(shù)據(jù)猿導(dǎo)讀】 如今,我們的云計算技術(shù)可以利用群體智能、群體智慧、手機、網(wǎng)絡(luò)等聚集大量的數(shù)據(jù)。但到目前為止,人工智能領(lǐng)域取得的成就,僅僅是部分富人、擁有大數(shù)據(jù)的人在享受,對于大部分人來說,只能旁觀。楊強表示,遷移學(xué)習(xí)讓人人享受人工智能紅利

摘要:我們都在為人工智能技術(shù)歡呼,但問題是,人人都能享受到人工智能的紅利嗎?人工智能需要大數(shù)據(jù),但大多數(shù)的人并不擁有大數(shù)據(jù),這導(dǎo)致真正擁有大數(shù)據(jù)資源的人能把所有的資源都聚集在自己身邊,豪門更豪。對此,香港科技大學(xué)教授楊強在2016中國云計算大會上表示,我們可以發(fā)展技術(shù),得到其他人的幫助,得到別人知識的遷移,使我們在短時間內(nèi)通過小數(shù)據(jù)就能迅速成長。如果我們有能力把大數(shù)據(jù)的模型遷移到每一個人身上,人們就都能享受人工智能帶來的紅利。
我們都在為人工智能技術(shù)歡呼,但問題是,人人都能享受到人工智能的紅利嗎?人工智能需要大數(shù)據(jù),但大多數(shù)的人并不擁有大數(shù)據(jù),這導(dǎo)致真正擁有大數(shù)據(jù)資源的人能把所有的資源都聚集在自己身邊,豪門更豪。
對此,香港科技大學(xué)教授楊強在2016中國云計算大會上表示,我們可以發(fā)展技術(shù),得到其他人的幫助,得到別人知識的遷移,使我們在短時間內(nèi)通過小數(shù)據(jù)就能迅速成長。如果我們有能力把大數(shù)據(jù)的模型遷移到每一個人身上,人們就都能享受人工智能帶來的紅利。
人工智能得到快速發(fā)展
人工智能經(jīng)歷了漫長的發(fā)展歷程。人工智能的先驅(qū)阿蘭•圖林曾發(fā)問,機器可以思維嗎?從50年代開始,前人做出各種假設(shè),提出了很多關(guān)鍵性的問題。機器可以學(xué)習(xí)嗎?機器可以規(guī)劃嗎?機器可以推理嗎?
人們設(shè)想把老專家的一些思考、思維和知識遷移到計算機里,但后來發(fā)現(xiàn)這個過程非常艱難,因為把知識描述出來、表達出來、學(xué)習(xí)出來,并非易事。在嘗試的過程中,人們做出了很多努力。
在1990年代,IBM 公司推出一款國際象棋程序“深藍”,在當(dāng)年的人機大戰(zhàn)中,戰(zhàn)勝了當(dāng)時國際象棋世界冠軍卡斯帕羅夫,這一消息在世界范圍內(nèi)廣為流傳,這是人工智能的一個里程碑。但云計算是人工智能的前提,因為當(dāng)時并沒有能幫助人們收集大量數(shù)據(jù)的云計算,導(dǎo)致了數(shù)據(jù)量的不足。
如今,我們的云計算技術(shù)可以利用群體智能、群體智慧、手機、網(wǎng)絡(luò)等聚集大量的數(shù)據(jù)。今天的人工智能活躍起來,有以下幾個原因:
1、匯聚了大量的數(shù)據(jù)。無論是谷歌公司,還是國內(nèi)的互聯(lián)網(wǎng)公司,都匯聚了很多大數(shù)據(jù)。
2、今天的計算能力突飛猛進。
3、深度學(xué)習(xí)、強化學(xué)習(xí)等算法取得了很大的成就。人們可以用機器來做同聲翻譯,可以做非常好的人臉識別,基于圖像的搜索變得非常便利。作為一個辨別性的模型,深度學(xué)習(xí)模型可以轉(zhuǎn)化成一個生成模型。圖片識別性轉(zhuǎn)化成生成器可向深度學(xué)習(xí)描繪那些印象最深的情景,科學(xué)家可以面對圖片用文字問自然語言的問題,在圖片里得到答案,得到文字形式的回答。阿爾法狗很牛,是因為其積累了大量的棋譜,可以產(chǎn)生3千萬的盤面來訓(xùn)練。
資源不均導(dǎo)致的人工智能隱憂
從互聯(lián)網(wǎng)到人工智能的轉(zhuǎn)變,成功還是集中在大公司。到目前為止,人工智能領(lǐng)域取得的成就,僅僅是部分富人、擁有大數(shù)據(jù)的人在享受,對于大部分人來說,只能旁觀。沒有大數(shù)據(jù)資源的人,是否就不能享受人工智能的紅利呢?
在生物信息領(lǐng)域,可以獲得單條的基因鏈或蛋白質(zhì)鏈大量的數(shù)據(jù),但是把它和人的行為對應(yīng)起來的數(shù)據(jù)卻少之又少,能得到幾千條樣本已是相當(dāng)不錯,這和圖像識別里上千萬個樣本的數(shù)量簡直不能相提并論。所以,深度學(xué)習(xí)至今為止對于生物信息領(lǐng)域的大部分?jǐn)?shù)據(jù)還是無法使用。教育領(lǐng)域積累的大量數(shù)據(jù)也無法被大部分企業(yè)享用。
18世紀(jì)的工業(yè)大革命中,資本使得某些資本家變得越來越強大,使得窮人越來越窮,富人越來越富,今天的智能革命也有這樣的危險。數(shù)據(jù)是資本、是石油,有數(shù)據(jù)的人能夠提供越來越多的服務(wù),也就能夠得到更多的數(shù)據(jù)。這會不會形成一些智能寡頭?這才是對人類最大的危險,而并不是人工智能本身。
人工智能可以將我們的能力擴大,我們希望所有人都能享受人工智能帶來的紅利,該怎么做?
遷移學(xué)習(xí)讓人人享受人工智能紅利
楊強表示,他們在這方面做了很多努力,其中一個努力是遷移學(xué)習(xí)。如果能在計算機上做到遷移,就可以在數(shù)據(jù)量少的情況下得到效率的提高。例如,當(dāng)我們來到一個新的領(lǐng)域時,如果有能力把過去的模型遷移到新的領(lǐng)域,那么在新的領(lǐng)域就不需要過多數(shù)據(jù)。這樣一來,小數(shù)據(jù)也可以享受人工智能的福利。
比如,在推薦領(lǐng)域有一個冷啟動問題,即在一個新的領(lǐng)域沒有足夠的新數(shù)據(jù)。解決冷啟動問題的方法就是把過去通過大數(shù)據(jù)建好的模型遷移到新領(lǐng)域,使得人們在新的領(lǐng)域只用少數(shù)的數(shù)據(jù)也可以把工作做好。
同時,可以讓機器讀取文字,變成對圖像有用的知識,這樣一來,知識就可以在不同的表達之間做遷移。研究發(fā)現(xiàn),讓機器讀一千個字,就可以足夠好地識別一幅圖片,也就是說書并不需要無限的讀下去。把遷移學(xué)習(xí)和強化學(xué)習(xí)相結(jié)合,使得我們不需要訓(xùn)練很長時間,就可以學(xué)會新的技能。
在貸款方面,貸款往往都是小額貸款,大額貸款的樣本非常少,無法做對應(yīng)的模型。楊強介紹,最近他們的團隊通過遷移學(xué)習(xí)把小額貸款的大量數(shù)據(jù)產(chǎn)生的模型,遷移到大額貸款的少數(shù)樣本上,取得了非常大的成功。這樣,只有小數(shù)據(jù)的人也能夠享受人工智能紅利了。
來源:中國軟件網(wǎng)
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重