最新AI:无需被告知规则就能自己玩转游戏?
2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最好的棋手。一年后,工作继续完善,AlphaGo Zero创建。AlphaGo通过观察业余比赛和专业比赛学会了围棋,而AlphaGo Zero能通过简单地与自己对战来掌握游戏。然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋、国际象棋和将棋。这些AI的共同特点是,它
原创
2020-12-25 08:00:24
来源:钉科技  

2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最好的棋手。一年后,工作继续完善,AlphaGo Zero创建。AlphaGo通过观察业余比赛和专业比赛学会了围棋,而AlphaGo Zero能通过简单地与自己对战来掌握游戏。然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋、国际象棋和将棋。

image.png

这些AI的共同特点是,它们必须掌握游戏规则然后再进行培训。DeepMind的最新AI MuZero不需要游戏的规则即可掌握游戏。与DeepMind之前的AI算法一样,MuZero具有相同甚至更好的能力。  

MuZero没有尝试对所有模型进行建模,而只是尝试考虑那些对决策至关重要的因素。正如DeepMind所指出的,这是作为人类所做的事情。当大多数人看着窗外,看到地平线上形成乌云时,他们通常不会陷入乌云是如何形成之类的问题。相反,它们思考的是如果出门应该穿什么以防止被淋湿。MuZero就是做类似这样的事情。

MuZero在做决定时会考虑三件事。首先,它会考虑上一次行动的结果、当前所处的位置以及下一次行动的最佳方案。这种看似简单的方法使MuZero成为迄今为止DeepMind最有效的算法。在测试中DeepMind发现,MuZero与之前的AI算法表现都一样好。而且,给它的时间越多,它提供的解决方案就越好。即使加入了时间限制,比如在行动前限制吃豆人女士的模拟次数,MuZero也取得了不错的效果。

该公司表示,MuZero的学习能力有一天可以帮助解决没有简单规则领域的复杂问题。(钉科技根据《engadget》消息编译)

最新文章
1
智联万物 AI赋未来! 2025电博会即将开幕!
2
BOE(京东方)携新能源领域新品亮相2025服贸会 引领绿色转型新动能
3
海尔松下引领四筒洗衣机“争夺战”,分区洗护谁执牛耳?
4
库克献出奇招!iPhone Air是在为苹果折叠屏手机铺路?
5
AI时代终端大变局I端侧AI成物联终端进化“芯”引擎
6
IFA 2025:中国电视走向全世界,智能Ai成行业主旋律
7
空调价格进入一个变盘阶段
8
17999元起!华为Mate XTs三折叠今天首销:10.1英寸+麒麟9030
9
iPhone Air在华发售延期!苹果回应:力争尽快在中国推出
10
华帝股份半年报公布:整体毛利率水平攀升至43.54%,同比提升2.86%
11
IFA、RE+双展亮剑全球:华宝新能重构“从户外到户用”绿电生态
12
快手发布多模态大模型Keye-VL-1.5 8B性能领先、视频理解能力更强
13
快手“我的哇赛时刻”公益影像展览举行,科技向善为乡村学生架起梦想桥梁
14
2025年中德可持续发展论坛举行,快手推动女性在经济转型中稳步发展
15
智媒融合 赋能未来 ——CCNS & ISBT 2025在乌鲁木齐隆重召开
16
万和电气上半年业务结构生变:厨电扛大旗,生活热水承压前行
17
支持双eSIM!苹果iPhone 17 Air首发eSIM版本
18
壁挂炉市场大盘趋稳,“家电化”引领下行业如何升级?
19
“三句话”说说新能源汽车产业发展成效
20
追觅正式官宣入局电视赛道,能否带来差异化价值是关键
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512