最新AI:无需被告知规则就能自己玩转游戏?
2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最好的棋手。一年后,工作继续完善,AlphaGo Zero创建。AlphaGo通过观察业余比赛和专业比赛学会了围棋,而AlphaGo Zero能通过简单地与自己对战来掌握游戏。然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋、国际象棋和将棋。这些AI的共同特点是,它
原创
2020-12-25 08:00:24
来源:钉科技  

2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最好的棋手。一年后,工作继续完善,AlphaGo Zero创建。AlphaGo通过观察业余比赛和专业比赛学会了围棋,而AlphaGo Zero能通过简单地与自己对战来掌握游戏。然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋、国际象棋和将棋。

image.png

这些AI的共同特点是,它们必须掌握游戏规则然后再进行培训。DeepMind的最新AI MuZero不需要游戏的规则即可掌握游戏。与DeepMind之前的AI算法一样,MuZero具有相同甚至更好的能力。  

MuZero没有尝试对所有模型进行建模,而只是尝试考虑那些对决策至关重要的因素。正如DeepMind所指出的,这是作为人类所做的事情。当大多数人看着窗外,看到地平线上形成乌云时,他们通常不会陷入乌云是如何形成之类的问题。相反,它们思考的是如果出门应该穿什么以防止被淋湿。MuZero就是做类似这样的事情。

MuZero在做决定时会考虑三件事。首先,它会考虑上一次行动的结果、当前所处的位置以及下一次行动的最佳方案。这种看似简单的方法使MuZero成为迄今为止DeepMind最有效的算法。在测试中DeepMind发现,MuZero与之前的AI算法表现都一样好。而且,给它的时间越多,它提供的解决方案就越好。即使加入了时间限制,比如在行动前限制吃豆人女士的模拟次数,MuZero也取得了不错的效果。

该公司表示,MuZero的学习能力有一天可以帮助解决没有简单规则领域的复杂问题。(钉科技根据《engadget》消息编译)

最新文章
1
苹果iPhone 18 Pro带节奏,三星Galaxy S27要复活可变光圈?
2
年前最后一次更新!苹果发布iOS 26.3正式版:可与安卓无缝换机
3
2025年中国线上智能手表排名:华为销量大涨46.8%!稳居第一
4
夏普出售液晶面板工厂的计划告吹:苹果MacBook/iPad屏幕供应面临中断风险
5
2025快手百大主播嘉年华暨百大主播之夜燃动横琴,见证行业新标杆
6
全域聚势,年货爆发,快手磁力引擎构建年货节经营新生态,助力商家抢占新春消费红利
7
快手技术团队发布研发范式跃迁成果 AI驱动研发提效进入组织级阶段
8
REDMI杀入风扇赛道!全新旗舰搭载主动散热:性能开挂
9
华为阔屏直板机已立项:16:9比例!今年登场
10
演唱会拍神图,为啥全是这两个品牌的手机?
11
鸿蒙登顶,蔚小理上演“胜利轮回”,1月车市销量跌惨了
12
小米18 Pro影像有望迎来升级!或将搭载双2亿像素镜头
13
iQOO Z11系列新机入网,含双版本覆盖不同档位市场
14
清洁电器“具身化”,会是行业下一个风口吗?
15
别只盯着电视买,一款电视盒子也能让电视秒变高配
16
中国屏实力霸屏ISE2026:从奥运赛场到商业战场,B端出海这么猛?
17
空调市场正在好起来
18
小米17 Max上半年发布:取消背屏!加大电池
19
iPhone 18 Pro首发!苹果iOS 27有两大升级
20
内存价飙升90%!手机厂商考虑找回拓展存储卡设计 支持吗
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512