AlphaGo Zero 横空出世,无师自通完爆阿法狗

来源:投稿
作者: 达尔文
2017年10月19日

今年 5 月的人机对局中,柯洁 9 段以 0:3 不敌 AlphaGo,随后 Deepmind 在围棋上进一步探索。Nature 今天的论文就详细介绍了谷歌 DeepMind 团队最新的研究成果。


阿法狗战胜人类,其棋艺的精进是建立在计算机对海量历史棋谱学习参悟的基础之上,实现自我进化和超越。

而新一代的阿法元(AlphaGo Zero)完全是从零开始,不需要任何历史和人类的指导,通过全新的强化学习方式自己成为自己的老师,在棋艺上不仅达到了超越人类的精通程度,也打败了它的师兄阿法狗(AlphaGo)。

达到这样一个水准,阿法元只需要在4个TPU上,花三天时间,自己左右互搏490万棋局。而它的师兄阿法狗,需要在48个TPU上,花几个月的时间,学习三千万棋局,才打败人类。



美国杜克大学人工智能专家陈怡然教授在接受知社采访了时,说到:这恰好证明了人类经验由于样本空间大小的限制,往往都收敛于局部最优而不自知(或无法发现),而机器学习可以突破这个限制。之前大家隐隐约约觉得应该如此,而现在是铁的量化事实摆在面前!

虽然这一技术还处于早期阶段,但阿法元(AlphaGo Zero)的突破使得我们在未来面对人类面对的一些重大挑战时充满信心(如能源问题)。

人工智能到底将何去何从?如果将该技术应用到其他问题上,会对我们的生活产生哪些根本性的影响呢?

论文链接:http://nature.com/articles/doi:10.1038/nature24270

展开阅读全文
31 收藏
分享
加载中
精彩评论
人类建造了超级计算机“诺亚”,用来计算出改善地球环境的方法,最终诺亚计算出的方法是:消灭人类。
2017-10-19 16:07
26
举报
不是狗蛋吗?
2017-10-19 16:12
9
举报
__c
AlphaGo Zero翻译成阿法元,万一以后人家真的又出一个AlphaGo Meta要怎么翻译
2017-10-19 15:07
5
举报
围棋还是有规则的
2017-10-19 14:49
5
举报
人类经验机器也可以自己总结了
2017-10-19 17:28
2
举报
最新评论 (42)
阿法狗蛋
2017-10-21 00:04
0
回复
举报
我的瓜子呢
2017-10-20 12:55
0
回复
举报
这玩意要是拿来限制上网,那太厉害了
2017-10-20 04:28
0
回复
举报

引用来自“孤月蓝风”的评论

人类建造了超级计算机“诺亚”,用来计算出改善地球环境的方法,最终诺亚计算出的方法是:消灭人类。

引用来自“阿信sxq”的评论

然后执行了它

引用来自“3789”的评论

那以后得转行做猎人或者机械师了��

引用来自“六月是你的谎言”的评论

@红薯 有乱码

引用来自“纯洁徐”的评论

有那么一种生物,贪婪嗜血,不停繁衍,毫无缘由的掠夺,并不断蚕食自己赖以生存的环境,且与其宿主共同走向灭亡!------病毒,人类又何尝不是如此?
这是王牌特工1的剧本嘛
2017-10-20 00:40
1
回复
举报

引用来自“孤月蓝风”的评论

人类建造了超级计算机“诺亚”,用来计算出改善地球环境的方法,最终诺亚计算出的方法是:消灭人类。

引用来自“阿信sxq”的评论

然后执行了它

引用来自“3789”的评论

那以后得转行做猎人或者机械师了��

引用来自“六月是你的谎言”的评论

@红薯 有乱码
有那么一种生物,贪婪嗜血,不停繁衍,毫无缘由的掠夺,并不断蚕食自己赖以生存的环境,且与其宿主共同走向灭亡!------病毒,人类又何尝不是如此?
2017-10-19 22:09
1
回复
举报

引用来自“红薯”的评论

围棋还是有规则的
到中国来玩套路试试
2017-10-19 22:06
0
回复
举报

引用来自“╭ァの修罗”的评论

评论区真反智
评论区真反智
2017-10-19 21:07
0
回复
举报
评论区真反智
2017-10-19 20:54
0
回复
举报

引用来自“孤月蓝风”的评论

人类建造了超级计算机“诺亚”,用来计算出改善地球环境的方法,最终诺亚计算出的方法是:消灭人类。

引用来自“阿信sxq”的评论

然后执行了它

引用来自“3789”的评论

那以后得转行做猎人或者机械师了��
@红薯 有乱码
2017-10-19 20:34
0
回复
举报

引用来自“SupNatural”的评论

不是狗蛋吗?
你说的太对了
2017-10-19 19:58
0
回复
举报
更多评论
42 评论
31 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部