AlphaGo再升級,一天學(xué)會三種最復(fù)雜的棋類
【數(shù)據(jù)猿導(dǎo)讀】 北京時(shí)間12月7日,AlphaGo研究團(tuán)隊(duì)DeepMind近日再次公布了AlphaGo的近況。新版AlphaGo可以在一天內(nèi)從零開始學(xué)習(xí),然后打敗國際象棋、日本將棋目前最厲害的AI

北京時(shí)間12月7日,AlphaGo研究團(tuán)隊(duì)DeepMind近日再次公布了AlphaGo的近況。新版AlphaGo可以在一天內(nèi)從零開始學(xué)習(xí),然后打敗國際象棋、日本將棋目前最厲害的AI。新版AlphaGo從零開始,通過三天的自我學(xué)習(xí),還能擊敗AlphaGo Zero,也就是說三天內(nèi)打敗自己超越自我。
今年10月DeepMind宣布,最新版本的AlphaGo Zero不需要借助人類的經(jīng)驗(yàn),通過自我學(xué)習(xí)3小時(shí)后就會下圍棋,36小時(shí)后就打敗了它的“二哥”AlphaGo Lee,就是去年3月與李世石進(jìn)行人機(jī)大戰(zhàn)那個(gè)版本的AI,而且是能以100比0的絕對優(yōu)勢碾壓取勝。AlphaGo Zero在誕生的第21天,就打敗了60連勝的Master,Master后來在今年烏鎮(zhèn)的人機(jī)大戰(zhàn)中戰(zhàn)勝了世界圍棋第一人柯潔。AlphaGo Zero只需要用40天,就能對戰(zhàn)Master的勝率達(dá)到90%,成為最強(qiáng)的人工智能。
不過最新版本的AlphaGo更強(qiáng)。DeepMind介紹,在這次研究中,研究團(tuán)隊(duì)使用了5000個(gè)一代TPU來生成自我對弈棋譜,用另外64個(gè)二代TPU來進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。而在此前AlphaGo Zero的神經(jīng)網(wǎng)絡(luò)訓(xùn)練中使用的則是GPU。
最新版的AlphaGo,能在24小時(shí)內(nèi)教會自己玩三種復(fù)雜的棋類游戲——圍棋、國際象棋、日本將棋。這三種棋里面,對人類來說圍棋可能是最復(fù)雜的,但對AI而言圍棋最簡單,因?yàn)閲宓囊?guī)則最簡單。日本將棋相對比國際象棋還復(fù)雜,但是這些都難不倒AlphaGo。目前國際象棋、日本將棋的AI水平已經(jīng)遠(yuǎn)遠(yuǎn)超過了人類頂尖棋手,而最新版的AlphaGo可以通過一天不到的時(shí)間,就能橫掃這些AI。
10月的時(shí)候被公布的最新版的AlphaGo名為AlphaGo Zero,AlphaGo Zero要戰(zhàn)勝原來最厲害版本的自己,需要自我修煉近40天,但這次他只需要從零開始自我修煉三天,就能打敗自己。
來源:騰訊體育
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯(cuò)過的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新