微比恩 > 信息聚合 > 苹果连放4个开源“小模型”,跑分却不到微软Phi-3一半,不卷性能卷效率?

苹果连放4个开源“小模型”,跑分却不到微软Phi-3一半,不卷性能卷效率?

2024-04-25 19:31:34来源: 36氪

文|李然 陈斯达编辑|苏建勋美国当地时间4月24日,苹果在Hugging Face上放出了自己的开源“小模型”家族——4个预训练的大模型OpenELM。图源:X四款模型体量极小,参数量分别为 270M、450M、1.1B和3B。图源:Hugging Face在Hugging Face页面上苹果表示,OpenELM(Open-source Efficient Language Models,即“开源高效语言模型”)在诸如电子邮件编写等文本相关任务上,有较高的执行效率。系列模型已经开源,可供开发人员使用。4月22日发布的相关论文中,研究人员介绍了OpenELM的整个框架,包括数据准备、训练、微调以及测评结果等。图源:论文论文地址:https://arxiv.org/pdf/2404.14619.pdfCoreNet地址:https://github.com/apple/corenet模型下载地址:https://huggingfac

关注公众号
标签: 微软 苹果 开源