图片来源@视觉中国文|读懂财经自打ChatGPT横空出世以来,有一个问题始终萦绕在很多人的心里:万一有一天AI变坏了怎么办?从目前看,这样的担心并非毫无根据。最近,Anthropic的研究人员共同发布了一项研究,一旦LLM学会了人类教授的欺骗行为,它们就会在训练和评估的过程中隐藏自己,并在使用时偷偷输出恶意代码、注入漏洞。即便在后期进行安全训练也很难消除。正如Anthropic所说,我们已经尽了最大努力,但模型的欺骗行为还在发生。用OpenAI科学家Karpathy的话说,仅仅通过应用当前标准的安全微调措施,是无法确保模型安全的。当行业所有的注意力都放在AGI终极目标的时候,AI安全就像一条暗线,随着模型更迭而不断延伸。如果说先进的AI更像是给现有生产力加杠杆,那么其所带来的混乱也必然是远超预期。不过好在,头部AI公司也都在纷纷加大AI安全的研究。根据最新消息,OpenAI 宣布将成立一个“集体对齐”(C
“浓眉大眼”的AI,也学会骗人了?
2024-01-18 19:46:09来源: 钛媒体
关注公众号
赞
你的鼓励是对作者的最大支持
- 2024 ACCA-SNAI年度研讨会: 为新质生产力注入财会动能2024-05-16 17:30:00
- 谷歌 2 小时复仇硬刚 GPT-4o:Gemini 颠覆搜索,视频 AI 对抗 Sora2024-05-16 13:24:48
- Rapidus 携手 RISC-V 设计企业 Esperanto,开发低功耗数据中心 AI 芯片2024-05-16 14:09:33
- 含 AI 工具中的“满分”漏洞,英特尔发 41 份公告修复 90 个漏洞2024-05-16 14:42:29
- 魅族全新 Flyme AIOS 登场:支持一键 AI 搜索、AI 接听等2024-05-16 14:52:28
- GPT-4o 再秀神操作,“复现”OpenAI 总裁讲课,网友当真了2024-05-16 14:56:58
- 599 元,魅族 LIVE AI 真无线 Hi-Fi 降噪耳机发布2024-05-16 15:31:33
- 乐道首车 L60 开启预售;字节跳动发布豆包大模型;微软中国AI团队整体打包赴美|Do早报2024-05-16 08:54:47
- 智氪 | AI锋芒初现,助腾讯业绩大超预期2024-05-15 18:09:46
- 产业思维打造食品创新高地,Foodaily创博会2024圆满落幕!2024-05-15 19:31:48
- 1今晚国内油价迎“两连降”,加满一箱 92 号汽油将少花 9 元
- 2雷诺汽车发布未来自动驾驶战略,将与文远知行探索公交领域实践
- 3Triskell Software 在《企业敏捷规划工具市场指南》中被评为 2024 年代表性供应商
- 4福达股份:拟定增募资不超3亿元,用于新能源汽车混合动力曲轴项目
- 5欧林生物:四价流感病毒裂解疫苗(MDCK细胞)获批开展临床试验
- 6睿创微纳成立智造技术公司 注册资本1亿
- 7中简科技:拟1500万元-3000万元回购公司股份
- 8哔哩哔哩在浙江成立数字文化公司 注册资本4188万美元
- 9富士推出 GF 500mm f / 5.6 中画幅相机镜头:抗水 + 6 轴防抖,3499 美元
- 10【钛晨报】证监会:从严打击严重危害市场平稳运行、侵害投资者合法权益等违法行为;字节跳动自研大模型豆包宣布正式对外提供服务…