关于大模型注意力机制,Meta 又有了一项新研究。通过调整模型注意力,屏蔽无关信息的干扰,新的机制让大模型准确率进一步提升。而且这种机制不需要微调或训练,只靠 Prompt 就能让大模型的准确率上升 27%。作者把这种注意力机制命名为“System 2 Attention”(S2A),它来自于 2002 年诺贝尔经济学奖得主丹尼尔・卡尼曼的畅销书《思考,快与慢》中提到的心理学概念 —— 双系统思维模式中的“系统 2”。所谓系统 2 是指复杂有意识的推理,与之相对的是系统 1,即简单无意识的直觉。S2A 通过提示词对 Transformer 中的注意力机制进行了“调节”,使模型整体上的思考方式更接近系统 2。有网友形容,这种机制像是给 AI 加了一层“护目镜”。此外,作者还在论文标题中说,不只是大模型,这种思维模式或许人类自己也需要学习。那么,这种方法具体是如何实现的呢?避免大模型被“误导”传统大模型常用的 Transformer
更像人脑的新型注意力机制,Meta 让大模型自动屏蔽任务无关信息,准确率提高 27%
2023-11-27 23:18:36来源: IT之家
![](/images/qrcode_for_gh_5f0dab6cf0de_258.jpg)
关注公众号
赞
你的鼓励是对作者的最大支持
- Apple Intelligence 上线前,苹果宣布加入美国 AI 安全协议:OpenAI、亚马逊、谷歌、Meta、微…2024-07-26 20:02:51
- 只做企业大模型的「Cohere」,获5亿美元融资,估值超55亿美元 | 最前线2024-07-25 11:27:47
- 百度AI大模型多场景赋能医疗,落地临床诊疗尚有距离 | 最前线2024-07-25 11:30:20
- 大模型初创「百川智能」完成50亿元A轮融资,北上深国资入局 | 36氪独家2024-07-25 12:06:54
- 国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM2024-07-25 16:45:33
- Meta Llama 3.1模型现已在亚马逊云科技正式可用2024-07-24 17:40:00
- 氪星晚报|Meta发布LLAMA 3.1 405B开源人工智能模型;通义大模型成巴黎奥运会首个AI大模型应用技术提供方;…2024-07-24 17:34:25
- Meta发布LLAMA 3.1 405B开源人工智能模型2024-07-24 07:11:08
- 元脑伙伴共行记丨华胜天成:大模型应用落地 技术行业优势需互补2024-07-23 16:46:00
- 努比亚发布两款旗舰手机:自研星云AI大模型 还支持卫星通讯2024-07-23 19:53:36