产品分类
公司地址

联系方式

http://www.qiaosc8.com
TEL:13578621165

您的位置:主页 > 关于公司 > 综合新闻

AlphaZero完胜三大棋类程序 5000个TPU自学一天

发布时间:2017-12-12 21:44  浏览:

  来源:民众号 量子位

  6日,DeepMind团队又在arXiv上扔了个重磅炸弹,新一代AlphaZero在用了强劲的打算资源(5000个一代TPU跟64个二代TPU)之后,用不到24小时的时光自我对弈(tabula rasa,也叫白板)强化学习,接连击败了三个世界冠军级的程序 (国际象棋、将棋、围棋)。

  △ AlphaZero跟国际象棋冠军程序对弈

  其中包括上一代冠军围棋程序AlphaGo Zero,这个程序发布还不到两个月,DeepMind就又把自己颠覆了(所以谷歌团队自我进化速度的时间单位都是按天计,可怕)。

  AlphaZero的百局战绩

对弈国际象棋程序Stockfish:28胜,72平;

对弈将棋程序 Elmo:90胜,2平,8负;

对弈围棋程序AlphaGo Zero:60胜,40负。

  AlphaZero自我对弈的训练时间

练习次数 | 训练时间 | 对弈冠军棋类程序

30万,2小时,击败将棋Elmo

11万,4小时,击败国际象棋Stockfish

16.5万,8小时,击败围棋AlphaGo

  把Go去掉,象征着AlphaZero ,已经是比AlphaGo Zero更通用的程序。

  始终以来,只管众多顶尖的AI的程序都超过了人类世界冠军的水平,但它们都只能在单一的范畴实行单一的义务,并不能把这种击败人类的超才干泛化到其余任务中。

  而DeepMind的野心可不仅仅是在棋类游戏上超越人类,这次他们研究出了这个更通用的程序AlphaZero,将会立即投入到蛋白折叠的应用上。

  官方称,他们不久就会发表相关论文,通过检测出蛋白错误折叠来快速诊断神经退行性疾病,比喻阿尔茨海默症,帕金森,囊状纤维化。

  等候AlphaZero在医疗健康范围的表现。

  更多棋技的探讨,可能参看知乎上的PENG Bo的评估:https://zhuanlan.zhihu.com/p/31749249

  原论文链接:https://arxiv.org/pdf/1712.01815.pdf

相干的主题文章: 相关的主题文章:
本文地址:http://www.qiaosc8.com/a/guanyugongsi/20171212/3.html
上一篇:上一篇:吕顺 商界棋王结缘女子围甲 章广跃 将建围棋小镇
下一篇:下一篇:没有了

无相关信息
Copyright © 腾讯分分彩平台www.qiaosc8.com 版权所有 地址:上海市浦东新区