继今年五月发布的首个千亿参数大模型 OPT-175B 后,Meta 又重磅推出「升级版」OPT-IML,这次有何提升?今年五月,MetaAI 官宣发布了基于 1750 亿参数的超大模型 OPT-175B,还对所有社区免费开放。12 月 22 日,该模型的更新版本 OPT-IML(Open Pre-trained Transformer)正式上线,Meta 称其「对 2000 个语言任务进行了微调,包含 1750 亿个参数」,还将为非商业研究用途免费开放。这次更新的 OPT-IML 的性能表现如何,先上两张图来看看。这次的 OPT-IML 创建了两种模型尺寸,分别是 30B 和 175B。与旧版 OPT 模型相比,OPT-IML 在 14 个标准 NLP 评估任务中的平均表现均优于 OPT。在零次学习任务上两种模型大小分别好 7%~ 和 32-shot 任务分别好 4%~ 和 0.4%~。在这项研究中,研究人员描述了增加模型和基准
Meta 千亿参数大模型 OPT-IML「升级版」来了,完整模型和代码公布
2022-12-26 18:25:02来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 扎克伯格最新发言:如果Meta停止创新,我就要完蛋了|钛媒体AGI2024-05-10 15:36:10
- 前 Oculus CTO:Meta 不会推出廉价 VR 头显,现款 Quest 产品线已是“成本价”2024-05-05 14:00:26
- Meta Quest 3 独占,VR 游戏《蝙蝠侠:阿卡姆之影》正式公开2024-05-02 15:03:17
- Meta Quest v65 更新再次“借鉴”苹果功能,可导入 iPhone 全景照片2024-05-01 16:25:19
- 36氪晚报|中国联塑等10亿元成立股权投资合伙企业;欧盟委员会对Meta公司启动正式调查程序;壳牌退出中国电力市场2024-04-30 20:26:45
- Meta 高管称将发布的 AR 眼镜会像初代 Oculus Rift 一样惊艳2024-04-28 10:14:31
- 阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型,与 Meta Llama3-70B 相媲美2024-04-27 20:38:56
- 全文|Meta Q1业绩会实录:虽然AI产品还没盈利 会持续投资和扩展规模2024-04-26 06:26:53
- 美股大型科技股盘前普跌,Meta跌超16%2024-04-25 20:51:48
- 高通与 Meta 宣布合作,优化 Llama 3 大语言模型在智能手机等终端运行2024-04-20 19:22:44