最新AI:无需被告知规则就能自己玩转游戏?
2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最好的棋手。一年后,工作继续完善,AlphaGo Zero创建。AlphaGo通过观察业余比赛和专业比赛学会了围棋,而AlphaGo Zero能通过简单地与自己对战来掌握游戏。然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋、国际象棋和将棋。这些AI的共同特点是,它
原创
2020-12-25 08:00:24
来源:钉科技  

2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最好的棋手。一年后,工作继续完善,AlphaGo Zero创建。AlphaGo通过观察业余比赛和专业比赛学会了围棋,而AlphaGo Zero能通过简单地与自己对战来掌握游戏。然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋、国际象棋和将棋。

image.png

这些AI的共同特点是,它们必须掌握游戏规则然后再进行培训。DeepMind的最新AI MuZero不需要游戏的规则即可掌握游戏。与DeepMind之前的AI算法一样,MuZero具有相同甚至更好的能力。  

MuZero没有尝试对所有模型进行建模,而只是尝试考虑那些对决策至关重要的因素。正如DeepMind所指出的,这是作为人类所做的事情。当大多数人看着窗外,看到地平线上形成乌云时,他们通常不会陷入乌云是如何形成之类的问题。相反,它们思考的是如果出门应该穿什么以防止被淋湿。MuZero就是做类似这样的事情。

MuZero在做决定时会考虑三件事。首先,它会考虑上一次行动的结果、当前所处的位置以及下一次行动的最佳方案。这种看似简单的方法使MuZero成为迄今为止DeepMind最有效的算法。在测试中DeepMind发现,MuZero与之前的AI算法表现都一样好。而且,给它的时间越多,它提供的解决方案就越好。即使加入了时间限制,比如在行动前限制吃豆人女士的模拟次数,MuZero也取得了不错的效果。

该公司表示,MuZero的学习能力有一天可以帮助解决没有简单规则领域的复杂问题。(钉科技根据《engadget》消息编译)

最新文章
1
全网播放量破亿的AI短片《纸手机》:可灵AI与中国式思念的一次双向奔赴”
2
诺特兰德深耕快手膳食赛道的成功密码与可复制路径
3
人生各有答案,生意自有新局,快手超级品牌周x新银发力量活动启幕
4
全屋智能的版本答案?这家企业战略发布会,以技术给出硬核解法
5
告别“保质不坏”,方太智慧原鲜冰箱引领冰箱保鲜进入“智慧原鲜”时代
6
买电视还是买投影?从以下几个方面入手准能帮你买到心怡的产品
7
家居卖场2025成绩单:巨头亏损、区域稳健,转型成集体共识
8
从优思益塌房看家电江湖:那些年我们追过的“假洋鬼子”
9
明天法庭见!索赔6500万元后,美的再告小米
10
主打四大服务,苏宁帮客独立IPO,这步棋走对了吗?
11
年增长率超320%!三星宣布已出货500万块显示器QD-OLED面板
12
大疆Pocket 4曝4月16日发布:8K视频+1英寸大底 3499起
13
折叠屏iPhone即将杀到,传三星独供面板,首批仅300万片?
14
海尔磁悬浮:一个企业定义了一个行业
15
三获金奖!海信RGB-Mini LED电视116UX亮相CITE2026获评“创新金奖”
16
太空算力何时走向商业爆发?
17
国产汽车芯片企业晒出“量产成绩单”
18
国内电视市场增长承压,海外市场成电视品牌增长洼地
19
预计2030年全球在线视频和电视收入将超过1.03万亿美元
20
涨价:一场对价格话语权的争夺
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512