图片来源@视觉中国文丨学术头条近年来,人工智能(AI)在强化学习算法的加持下,取得了令人瞩目的成就。比如在围棋、星际争霸 II 和 Dota 2 等诸多策略、竞技类游戏中,AI 都有着世界冠军级的表现,以及在机器人跑步、跳跃和抓握等技能的自主学习方面,也起到了显著的推动作用。如今,AI 可能要变得更 “聪明” 了。作为机器学习的一大关键领域,强化学习侧重如何基于环境而行动,其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。但是,这种算法思路有着明显的短板:许多成功案例都要通过精心设计、信息量大的奖励机制才能实现,当遇到很少给予反馈的复杂环境时,强化学习算法就很容易碰壁。因此,过往的 AI 难以解决探索困难(hard-exploration)的问题,这类问题通常伴随着奖励稀疏(sparse)且会有欺骗性(deceptive)
玩游戏胜过人类:全新增强学习算法,或助AI向真正智能学习体进化
2021-02-25 16:34:33来源: 钛媒体
关注公众号
赞
你的鼓励是对作者的最大支持
- 珂芝 Z98AI 三模机械键盘上架:主打人工智能功能、Gasket 结构,599 元2024-04-27 08:51:26
- 谷歌 Pixel 8a 手机宣传视频曝光:主打 Best Take、圈选即搜等诸多 AI 功能2024-04-27 09:04:42
- 浩瀚 V3 手机云台稳定器发布:支持 AI 跟拍、超广角运镜,569 元2024-04-27 10:43:21
- 印度第二大公司高管预言:生成式 AI 最快 1 年“摧毁”人类客服岗位2024-04-27 11:32:56
- 谷歌为 AI 拍照功能 RealFill 申请商标:可扩展和修复现有图像2024-04-27 14:53:33
- 消息称 OPPO XR 探索暂停,转向 AI Device、机器人2024-04-26 16:45:51
- 【IT之家开箱】联想昭阳 X7 AI 高能本图赏:轻薄有型,传承经典设计2024-04-26 16:51:23
- 【IT之家评测室】联想昭阳 X7 AI 高能本评测:AI 唱主角,产品力提升明显2024-04-26 17:35:05
- VAIO 全新蓝牙无线鼠标上架:支持三通道连接,售价 299 元2024-04-26 18:06:44
- 长安启源 A07 正式推送启源 OS 1.0 版本:新增车外音控、AI 对话、导航分屏等功能2024-04-26 18:12:45