2000 亿次开放学习后，DeepMind 的智能体“成精”了-微比恩

图片地址：https://img.ithome.com/newsuploadfiles/2021/8/0ea51ecf-7f95-4ec3-a0f9-21afd6fc4d29.png

有这样一批智能体，在完全没有见过的游戏任务里，也学会了游刃有余地解决目标。譬如面对下面这样一个高地，它们要取到上面的紫色金字塔。没有跳跃功能的它们，看似开始“焦躁”地乱扔起东西来，实则其中一块板子正好被“扔”成了楼梯，这不就巧了，目标完成！你可能会说这只是“瞎猫撞死耗子”罢了，但多次实验发现，该智能体可以复现该方法的！而且它还会不止一种方法，“我不上去，你下来”—— 直接借助板子把目标扒拉下来了！这也行？而这些成精了的智能体来自 DeepMind。现在，为了让 AI 更加多才多艺、举一反三，他们专门给智能体打造了一个包含了数十亿游戏任务的“元宇宙”XLand：让智能体在不断扩展、升级的开放世界中通过上亿次的训练练就了不俗的泛化能力。最终效果就像前面看到的，无需在新游戏中从头训练，它们就能自主解决任务！DeepMind 也因此发表了一篇论文，就叫做：《从开放学习走出来的通用智能体》。如何做到的呢？“元宇宙”XLand最功不可没之一