微比恩 > 信息聚合 > 顶级 AI 智能体不会社交、创业远不如人类:卡内基梅隆大学等称其最多完成 24% 任务

顶级 AI 智能体不会社交、创业远不如人类:卡内基梅隆大学等称其最多完成 24% 任务

2025-01-26 16:38:09来源: IT之家

智能体究竟能否应对现实世界的复杂性?The Agent Company 近日提出了一项评估基准,让多个智能体尝试自主运营一个软件公司。结果表明,即使是当前最先进的智能体,也无法自主完成大多数任务。如今,基于大模型的智能体,已经能完成许多在几年前还无法想象的任务,进步的速度是如此之快,以至于有些人甚至声称,在接下来的几年内,大多数人类劳动可能都可以实现自动化。然而近日 CMU、杜克大学等机构发表的一项研究却给这一期待泼了一盆凉水。智能体运营公司还不可行论文链接:https://arxiv.org/abs/2412.14161该研究开发了一个全部由大模型驱动的智能体组成的虚拟软件开发公司 The Agent Company,与人类员工类似,智能体需要执行软件开发、项目管理、财务分析等典型的商业环境中的任务。智能体与环境互动,以及智能体间的协作以完成真实世界任务智能体所用的环境完全基于开源软件及主流的大模型接口,并可自行托管以实现可复

关注公众号
标签: 创业