最新AI:无需被告知规则就能自己玩转游戏?
2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最好的棋手。一年后,工作继续完善,AlphaGo Zero创建。AlphaGo通过观察业余比赛和专业比赛学会了围棋,而AlphaGo Zero能通过简单地与自己对战来掌握游戏。然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋、国际象棋和将棋。这些AI的共同特点是,它
原创
2020-12-25 08:00:24
来源:钉科技  

2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最好的棋手。一年后,工作继续完善,AlphaGo Zero创建。AlphaGo通过观察业余比赛和专业比赛学会了围棋,而AlphaGo Zero能通过简单地与自己对战来掌握游戏。然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋、国际象棋和将棋。

image.png

这些AI的共同特点是,它们必须掌握游戏规则然后再进行培训。DeepMind的最新AI MuZero不需要游戏的规则即可掌握游戏。与DeepMind之前的AI算法一样,MuZero具有相同甚至更好的能力。  

MuZero没有尝试对所有模型进行建模,而只是尝试考虑那些对决策至关重要的因素。正如DeepMind所指出的,这是作为人类所做的事情。当大多数人看着窗外,看到地平线上形成乌云时,他们通常不会陷入乌云是如何形成之类的问题。相反,它们思考的是如果出门应该穿什么以防止被淋湿。MuZero就是做类似这样的事情。

MuZero在做决定时会考虑三件事。首先,它会考虑上一次行动的结果、当前所处的位置以及下一次行动的最佳方案。这种看似简单的方法使MuZero成为迄今为止DeepMind最有效的算法。在测试中DeepMind发现,MuZero与之前的AI算法表现都一样好。而且,给它的时间越多,它提供的解决方案就越好。即使加入了时间限制,比如在行动前限制吃豆人女士的模拟次数,MuZero也取得了不错的效果。

该公司表示,MuZero的学习能力有一天可以帮助解决没有简单规则领域的复杂问题。(钉科技根据《engadget》消息编译)

最新文章
1
奕斯伟计算 | RISC-V OLED触控产品斩获“中国芯”优秀技术创新产品奖
2
DTC2025|TCL华星印刷OLED小尺寸突破,全产业技术创新布局
3
九昆仑低碳科技:以科技构建全球碳中和新生态
4
好设计 见未来:2025家电行业“好设计”评测发布会在北京盛大启幕
5
快手电商“宝藏小城”南通站收官,高效引爆南通家纺商达粉丝与生意增量
6
一加联动快手超级新品日打爆新品营销,首销日品牌GMV超千万
7
iQOO新机首发撬动双11爆发,超级新品日首销单品GMV破1500万
8
单款羽绒服两日爆卖千万,骆驼快手双11如何将品牌力转为购买力?
9
AI+显示:一场“双向奔赴”的产业革命
10
中国电视市场10月整机出货量324万台,创今年最大跌幅
11
三星首款三折叠手机Galaxy Z TriFold配置曝光:搭载5600mAh电池,预计12月5日发布
12
AMD官方确认:Zen6 CPU性能提升70%!
13
首发新麒麟!华为Mate X7全新外观揭晓
14
OPPO Find X9 Pro卫星通信版开售:同时能装四个号!双eSIM+双SIM卡
15
酷风空调突袭千元市场,行业价格战一触即发?
16
电视行业增长逻辑迭代:从规模扩张到“技术+场景”赋能
17
双11全渠道销量销额双冠王!海信电视创新驱动再登高峰
18
TCL电视双11全周期霸榜销量第一,SQD技术站稳顶级画质地位
19
9月洗衣机内销市场需求走低 出口市场放量
20
9月空调产销双双下滑
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512