微比恩 > 信息聚合 > 2000 亿次开放学习后,DeepMind 的智能体“成精”了

2000 亿次开放学习后,DeepMind 的智能体“成精”了

2021-08-05 14:23:17来源: IT之家

有这样一批智能体,在完全没有见过的游戏任务里,也学会了游刃有余地解决目标。譬如面对下面这样一个高地,它们要取到上面的紫色金字塔。没有跳跃功能的它们,看似开始“焦躁”地乱扔起东西来,实则其中一块板子正好被“扔”成了楼梯,这不就巧了,目标完成!你可能会说这只是“瞎猫撞死耗子”罢了,但多次实验发现,该智能体可以复现该方法的!而且它还会不止一种方法,“我不上去,你下来”—— 直接借助板子把目标扒拉下来了!这也行?而这些成精了的智能体来自 DeepMind。现在,为了让 AI 更加多才多艺、举一反三,他们专门给智能体打造了一个包含了数十亿游戏任务的“元宇宙”XLand:让智能体在不断扩展、升级的开放世界中通过上亿次的训练练就了不俗的泛化能力。最终效果就像前面看到的,无需在新游戏中从头训练,它们就能自主解决任务!DeepMind 也因此发表了一篇论文,就叫做:《从开放学习走出来的通用智能体》。如何做到的呢?“元宇宙”XLand最功不可没之一

关注公众号