微比恩 > 信息聚合 > 百川智能Baichuan2-192发布,上下文窗口达35万字,一次读完《三体》| 最前线

百川智能Baichuan2-192发布,上下文窗口达35万字,一次读完《三体》| 最前线

2023-10-31 11:33:39来源: 36氪

文 | 虞景霖编辑 | 尚恩大模型发展到现在,上下文窗口的长度成为如今追逐的热点:OpenAI的GPT-4-32k的文字处理量约2.5万字,Anthropic的Claude 100k大约能处理8万字的文本,而前段时间杀出的黑马Kimi Chat的文字处理量达到了20万字。 百川智能一举超过所有对手,可以说“遥遥领先”。10月30日,百川智能发布Baichuan2-192K大模型,上下文窗口高达192k,能够处理约35万个汉字,是大模型Claude2的4.4倍,更是GPT-4的14倍,是目前全球最长的上下文窗口。百川创始人:王小川。来源:企业供图除了长度,Baichuan2-192K在文本生成质量、长上下文理解以及长文本问答、摘要等方面也表现亮眼。全球最长,拿下7个SOTALongEval是由加州大学伯克利分校联合其他高校发布,用于衡量模型对长窗口内容的记忆和理解能力的测评榜单,属于业内公认的长上下文窗口理解权威评测榜单

关注公众号
标签: AI 三体