智能体究竟能否应对现实世界的复杂性?The Agent Company 近日提出了一项评估基准,让多个智能体尝试自主运营一个软件公司。结果表明,即使是当前最先进的智能体,也无法自主完成大多数任务。如今,基于大模型的智能体,已经能完成许多在几年前还无法想象的任务,进步的速度是如此之快,以至于有些人甚至声称,在接下来的几年内,大多数人类劳动可能都可以实现自动化。然而近日 CMU、杜克大学等机构发表的一项研究却给这一期待泼了一盆凉水。智能体运营公司还不可行论文链接:https://arxiv.org/abs/2412.14161该研究开发了一个全部由大模型驱动的智能体组成的虚拟软件开发公司 The Agent Company,与人类员工类似,智能体需要执行软件开发、项目管理、财务分析等典型的商业环境中的任务。智能体与环境互动,以及智能体间的协作以完成真实世界任务智能体所用的环境完全基于开源软件及主流的大模型接口,并可自行托管以实现可复
顶级 AI 智能体不会社交、创业远不如人类:卡内基梅隆大学等称其最多完成 24% 任务
2025-01-26 16:38:09来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 突破融资困境:掌握必杀技与关键问题,开启创业成功之门2025-02-01 17:17:44
- 斯坦福女神辍学再创业:获 OpenAI 力挺,全球首个 0 代码 AI 工程师出世2025-01-30 16:11:12
- OpenAI 前 CTO 最隐秘 AI 创业:没名字没方向,挖走前东家高管,10 位顶尖人才投奔2025-01-17 14:48:09
- 帮黄峥创业,教巴菲特炒股,暴炒网易100倍,段永平也曾一无所有2025-01-11 11:00:00
- 回家创业一年,才知道县城的可能性有多大2025-01-04 16:25:05
- 2024年就这样过去了,2025年最想给各位创业者企业家说的就是八件事2025-01-01 17:51:48
- 县域小城创业家,和他们的乡土保卫战2024-12-31 08:20:00
- 2024年AI大牛,不爱大厂爱创业?2024-12-31 09:00:00
- 小米创业十五周年,SU7 限定色明天见2024-12-30 19:07:32
- 创业12年,钛媒体选择重新出发2024-12-24 18:52:12