微比恩 > 信息聚合 > 谷歌爆改 Transformer：“无限注意力”让 1B 小模型读完 10 部小说，114 倍信息压缩

谷歌爆改 Transformer：“无限注意力”让 1B 小模型读完 10 部小说，114 倍信息压缩

2024-04-12 21:47:41来源: IT之家

谷歌爆改 Transformer：“无限注意力”让 1B 小模型读完 10 部小说，114 倍信息压缩

图片地址：https://img.ithome.com/newsuploadfiles/2024/4/c55b882b-d064-4859-8864-c7f88138b194.png?x-bce-process=image/format,f_auto

谷歌大改 Transformer，“无限”长度上下文来了。现在，1B 大模型上下文长度可扩展到 1M（100 万 token，大约相当于 10 部小说），并能完成 Passkey 检索任务。8B 大模型在 500K 上下文长度的书籍摘要任务中，拿下最新 SOTA。这就是谷歌最新提出的 Infini-attention 机制（无限注意力）。它能让 Transformer 架构大模型在有限的计算资源里处理无限长的输入，在内存大小上实现 114 倍压缩比。什么概念？就是在内存大小不变的情况下，放进去 114 倍多的信息。好比一个存放 100 本书的图书馆，通过新技术能存储 11400 本书了。这项最新成果立马引发学术圈关注，大佬纷纷围观。加之最近 DeepMind 也改进了 Transformer 架构，使其可以动态分配计算资源，以此提高训练效率。有人感慨，基于最近几个新进展，感觉大模型越来越像一个包含高度可替换、商品化组件的软件栈了

关注公众号

标签：谷歌

提示：支持键盘“← →”键翻页

上一篇 OpenAI 内斗第二弹：Ilya 亲信、超级对齐团队 2 人惨遭开除，被批泄密

下一篇奇瑞 iCAR V23 亮相：骁龙 8155 座舱，支持高速 NOA、记忆泊车

赞

你的鼓励是对作者的最大支持

相关阅读

雷军、谷歌、联想、甲骨文……F1 为什么成了科技圈春晚？2024-04-27 16:51:13
谷歌计划投资 30 亿美元新建数据中心，并将设立 7500 万美元 Google AI 基金2024-04-27 16:59:56
谷歌 Pixel 8a 手机宣传视频曝光：主打 Best Take、圈选即搜等诸多 AI 功能2024-04-27 09:04:42
谷歌安卓 15 新特性：锁屏时收到连续通知时可降低音量、禁止振动2024-04-27 14:08:31
谷歌为 AI 拍照功能 RealFill 申请商标：可扩展和修复现有图像2024-04-27 14:53:33
代码显示谷歌正在为 ChromeOS 筹备新默认字体，从 Roboto 转向 Google Sans2024-04-27 15:09:35
美股大型科技股盘前多数上涨，谷歌涨超11%2024-04-26 20:48:39
谷歌发布安卓 15 Beta 1.2 测试版，修复“应用无响应”等五项问题2024-04-26 07:29:56
谷歌公布最新财报：营收 805 亿美元、同比增长 15%，将首次发放季度股息2024-04-26 08:31:06
谷歌安卓 15 优化“强制深色”底层算法：适配更多应用、界面更有沉浸感2024-04-26 09:22:05

热门排行榜

1日1周1月

免费发布分类信息

最新图片