滚动新闻
当前位置: > >文章详情

最新AI:无需被告知规则就能自己玩转游戏? 原创

2020-12-25 08:00:24      钉科技     

2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最好的棋手。一年后,工作继续完善,AlphaGo Zero创建。AlphaGo通过观察业余比赛和专业比赛学会了围棋,而AlphaGo Zero能通过简单地与自己对战来掌握游戏。然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋、国际象棋和将棋。

image.png

这些AI的共同特点是,它们必须掌握游戏规则然后再进行培训。DeepMind的最新AI MuZero不需要游戏的规则即可掌握游戏。与DeepMind之前的AI算法一样,MuZero具有相同甚至更好的能力。  

MuZero没有尝试对所有模型进行建模,而只是尝试考虑那些对决策至关重要的因素。正如DeepMind所指出的,这是作为人类所做的事情。当大多数人看着窗外,看到地平线上形成乌云时,他们通常不会陷入乌云是如何形成之类的问题。相反,它们思考的是如果出门应该穿什么以防止被淋湿。MuZero就是做类似这样的事情。

MuZero在做决定时会考虑三件事。首先,它会考虑上一次行动的结果、当前所处的位置以及下一次行动的最佳方案。这种看似简单的方法使MuZero成为迄今为止DeepMind最有效的算法。在测试中DeepMind发现,MuZero与之前的AI算法表现都一样好。而且,给它的时间越多,它提供的解决方案就越好。即使加入了时间限制,比如在行动前限制吃豆人女士的模拟次数,MuZero也取得了不错的效果。

该公司表示,MuZero的学习能力有一天可以帮助解决没有简单规则领域的复杂问题。(钉科技根据《engadget》消息编译)


文章详情:最新AI:无需被告知规则就能自己玩转游戏?

钉科技(微信号:dingkeji2015),专注TMT领域创新研究报道,第一批今日头条“百群计划”签约媒体和入驻头条号创作空间的科技新媒体,荣获腾讯2015年度最佳新锐自媒体,2016年腾讯企鹅号年度新媒体,2017年UC量子计划获奖新媒体,被中国科技信息评为“影响中国科技行业自媒体50人”,是2015-2016连续两年工信部手机与应用创新大赛专家评审媒体。商务合作请发邮件:BD@dingkeji.com

声明:本站原创文章文字版权归钉科技所有,转载务必注明作者和出处;本站转载的文章仅出于传递更多信息的目的,仅代表原作者观点,不代表钉科技立场,图文版权归原作者所有,如有侵权问题,请联系我们删除,邮箱:BD@dingkeji.com


钉科技技微信公众号二维码

关于我们

微信扫一扫,加关注

商务合作

  • QQ:61149512