微比恩 > 信息聚合 > 更像人脑的新型注意力机制，Meta 让大模型自动屏蔽任务无关信息，准确率提高 27%

更像人脑的新型注意力机制，Meta 让大模型自动屏蔽任务无关信息，准确率提高 27%

2023-11-27 23:18:36来源: IT之家

更像人脑的新型注意力机制，Meta 让大模型自动屏蔽任务无关信息，准确率提高 27%

图片地址：https://img.ithome.com/newsuploadfiles/2023/11/4268e758-470d-475d-9d4d-00c24c7b10b5.png?x-bce-process=image/format,f_auto

关于大模型注意力机制，Meta 又有了一项新研究。通过调整模型注意力，屏蔽无关信息的干扰，新的机制让大模型准确率进一步提升。而且这种机制不需要微调或训练，只靠 Prompt 就能让大模型的准确率上升 27%。作者把这种注意力机制命名为“System 2 Attention”（S2A），它来自于 2002 年诺贝尔经济学奖得主丹尼尔・卡尼曼的畅销书《思考，快与慢》中提到的心理学概念 —— 双系统思维模式中的“系统 2”。所谓系统 2 是指复杂有意识的推理，与之相对的是系统 1，即简单无意识的直觉。S2A 通过提示词对 Transformer 中的注意力机制进行了“调节”，使模型整体上的思考方式更接近系统 2。有网友形容，这种机制像是给 AI 加了一层“护目镜”。此外，作者还在论文标题中说，不只是大模型，这种思维模式或许人类自己也需要学习。那么，这种方法具体是如何实现的呢？避免大模型被“误导”传统大模型常用的 Transformer

关注公众号

标签： Meta 大模型

提示：支持键盘“← →”键翻页

上一篇江淮汽车：公司未收到华为共同投资邀请，且未参与投资及资本合作相关事项

下一篇消息称索尼下一代 Xperia 手机设计语言或发生改变

赞

你的鼓励是对作者的最大支持

相关阅读

Apple Intelligence 上线前，苹果宣布加入美国 AI 安全协议：OpenAI、亚马逊、谷歌、Meta、微…2024-07-26 20:02:51
只做企业大模型的「Cohere」，获5亿美元融资，估值超55亿美元 | 最前线2024-07-25 11:27:47
百度AI大模型多场景赋能医疗，落地临床诊疗尚有距离 | 最前线2024-07-25 11:30:20
大模型初创「百川智能」完成50亿元A轮融资，北上深国资入局 | 36氪独家2024-07-25 12:06:54
国际首个，我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM2024-07-25 16:45:33
Meta Llama 3.1模型现已在亚马逊云科技正式可用2024-07-24 17:40:00
氪星晚报｜Meta发布LLAMA 3.1 405B开源人工智能模型；通义大模型成巴黎奥运会首个AI大模型应用技术提供方；…2024-07-24 17:34:25
Meta发布LLAMA 3.1 405B开源人工智能模型2024-07-24 07:11:08
元脑伙伴共行记丨华胜天成：大模型应用落地技术行业优势需互补2024-07-23 16:46:00
努比亚发布两款旗舰手机：自研星云AI大模型还支持卫星通讯2024-07-23 19:53:36

热门排行榜

1日1周1月

免费发布分类信息

最新图片