微比恩 > 信息聚合 > 大模型 GPT-4 预测长这样：比 GPT-3 略大、纯文本、更注重最优计算与对齐

大模型 GPT-4 预测长这样：比 GPT-3 略大、纯文本、更注重最优计算与对齐

2022-04-22 09:44:17来源: IT之家

大模型 GPT-4 预测长这样：比 GPT-3 略大、纯文本、更注重最优计算与对齐

图片地址：https://img.ithome.com/newsuploadfiles/2022/4/4378ae7b-2a79-4497-ba11-dccdacf0af8d.png

不久前，谷歌发布基于他们最新一代人工智能架构 Pathways 研发的 5400 亿参数大模型 ——PaLM，具备标记因果关系、上下文理解、推理、代码生成等等多项功能，其中常识推理能力更是较以往的语言模型有较大提升。但同时，大家也一如既往地注意到 PaLM 的计算成本：用了 6144 块 TPU。如果租显卡训练，最高花费可能达到 1700 万美元（人民币超过 1 个亿，“一个小目标”）。显然，这很烧钱，不符合“经济可用”的原则。难怪业内人士常常吐槽：苦大模型久矣。如果模型往大走，一个劲地砸钱，何时是个尽头？有学者也向 AI 科技评论表示：类似 PaLM 这样的大模型在结果上确实取得了不错的突破，但训练与计算的成本非常高，没必要将许多任务拼在一起。对于大模型的未来发展，GPT 系列或许能提供一些新的见解。近日，Cambrian AI 的分析师 Alberto Romero 便发表了一篇文章，基于 OpenAI 首席执行官 Sam

关注公众号

提示：支持键盘“← →”键翻页

上一篇理想汽车回应被列入“预摘牌名单”：积极配合审计，香港上市地位不受影响

下一篇知乎正式在港交所挂牌上市，CEO 周源称“海盗船”回家了

赞

你的鼓励是对作者的最大支持

相关阅读

谷歌在欧洲重新设计 Cookie 追踪选项，可以一键拒绝2022-04-22 08:58:16
小米 MIX FOLD 2 折叠屏手机爆料：配色风格像小米 12 Ultra，相对轻薄电池容量减少，全新铰链折痕更小更易开合2022-04-22 08:58:38
人类在月球拍摄的第一张地球照片将销售，或卖出 128 万元高价2022-04-22 09:02:48
趣头条宣布停止自媒体创作平台服务和维护：未提现账户余额 6 月 28 日后自动清零2022-04-22 09:13:10
NASA 投资近 3 亿美元，让 SpaceX 和亚马逊用卫星演示太空通信2022-04-22 09:20:18
知乎正式登陆港交所：首日开盘破发跌超 22%，市值 81.35 亿港元2022-04-22 09:28:30
微软 Win11 极简任务栏上手：优化平板体验，但也缺了点小功能2022-04-22 09:33:58
《王者荣耀》供应商否认素材抄袭，称“创作思路和灵感均来源于本游戏宣传物料”2022-04-22 09:55:03
鸿海电动车基地 4 月 22 日正式启用，将展示软件开发测试平台2022-04-22 09:59:24
5499 元起，荣耀 Magic4 Pro /至臻版手机今天上午正式开售：搭载骁龙 8 Gen 1 芯片，5000 万像…2022-04-22 06:38:43

热门排行榜

1日1周1月

免费发布分类信息

最新图片