谷歌大改 Transformer,“无限”长度上下文来了。现在,1B 大模型上下文长度可扩展到 1M(100 万 token,大约相当于 10 部小说),并能完成 Passkey 检索任务。8B 大模型在 500K 上下文长度的书籍摘要任务中,拿下最新 SOTA。这就是谷歌最新提出的 Infini-attention 机制(无限注意力)。它能让 Transformer 架构大模型在有限的计算资源里处理无限长的输入,在内存大小上实现 114 倍压缩比。什么概念?就是在内存大小不变的情况下,放进去 114 倍多的信息。好比一个存放 100 本书的图书馆,通过新技术能存储 11400 本书了。这项最新成果立马引发学术圈关注,大佬纷纷围观。加之最近 DeepMind 也改进了 Transformer 架构,使其可以动态分配计算资源,以此提高训练效率。有人感慨,基于最近几个新进展,感觉大模型越来越像一个包含高度可替换、商品化组件的软件栈了
谷歌爆改 Transformer:“无限注意力”让 1B 小模型读完 10 部小说,114 倍信息压缩
2024-04-12 21:47:41来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 雷军、谷歌、联想、甲骨文……F1 为什么成了科技圈春晚?2024-04-27 16:51:13
- 谷歌计划投资 30 亿美元新建数据中心,并将设立 7500 万美元 Google AI 基金2024-04-27 16:59:56
- 谷歌 Pixel 8a 手机宣传视频曝光:主打 Best Take、圈选即搜等诸多 AI 功能2024-04-27 09:04:42
- 谷歌安卓 15 新特性:锁屏时收到连续通知时可降低音量、禁止振动2024-04-27 14:08:31
- 谷歌为 AI 拍照功能 RealFill 申请商标:可扩展和修复现有图像2024-04-27 14:53:33
- 代码显示谷歌正在为 ChromeOS 筹备新默认字体,从 Roboto 转向 Google Sans2024-04-27 15:09:35
- 美股大型科技股盘前多数上涨,谷歌涨超11%2024-04-26 20:48:39
- 谷歌发布安卓 15 Beta 1.2 测试版,修复“应用无响应”等五项问题2024-04-26 07:29:56
- 谷歌公布最新财报:营收 805 亿美元、同比增长 15%,将首次发放季度股息2024-04-26 08:31:06
- 谷歌安卓 15 优化“强制深色”底层算法:适配更多应用、界面更有沉浸感2024-04-26 09:22:05
- 1中科创达滴水OS整车操作系统亮相北京车展
- 2IBM助客户赢得中国信通院"可信AI案例"奖
- 3三七互娱:一季度净利润6.16亿元,同比下降20.45%
- 4“全国老字号产业投资基金”有望近期设立
- 5朱华荣:要培养长安汽车的“雷布斯”“余大嘴”,车市面临机遇远大于挑战
- 6洛阳钼业:一季度净利润20.72亿元,同比增长553.28%
- 7绝味食品:2023年净利润3.44亿元,同比增长46.63%
- 8宁德时代获北向资金净买入8.48亿元
- 9医疗健康行业周报 | 「月泉仿生」再获千万元天使+轮融资;数字化口腔健康品牌「Oclean欧可林」获1亿元C轮融资
- 10工商银行:一季度净利润876.5亿元,同比减少2.78%