卷疯了!世界最快的大模型 Groq 一夜之间爆火,能够每秒输出近 500 个 token。如此神速的响应,背后全凭自研的 LPU。一觉醒来,每秒能输出 500 个 token 的 Groq 模型刷屏全网。堪称是世界上速度最快的 LLM!相比之下,ChatGPT-3.5 每秒生成速度仅为 40 个 token。有网友将其与 GPT-4、Gemini 对标,看看它们完成一个简单代码调试问题所需的时间。没想到,Groq 完全碾压两者,在输出速度上比 Gemini 快 10 倍,比 GPT-4 快 18 倍。(不过就答案质量来说,Gemini 更好。)最关键的是,任何人可以免费用!进入 Groq 主页,目前有两种可以自选的模型:Mixtral8x7B-32k,Llama 270B-4k。地址:https://groq.com/与此同时,Groq API 也向开发者提供,完全兼容 OpenAI API。Mixtral 8x7B SMoE
世界最快大模型 Groq 登场:每秒 500 token 破纪录,自研 LPU 是英伟达 GPU 10 倍
2024-02-20 22:22:12来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用2024-05-14 17:01:24
- 对话李开复:中美大模型差距越来越小,我10年不“套现”|钛媒体AGI2024-05-13 18:41:00
- 软通动力受邀参加"昇思AI框架及大模型技术论坛" 共探AI框架未来发展2024-05-13 15:38:00
- 首期EPAI"元脑企智"企业大模型开发平台实践集训成功举行2024-05-13 16:45:00
- 消息称三星电子 8 层堆叠 HBM3E 内存尚未正式通过英伟达验证2024-05-13 18:21:47
- vivo 自研蓝心大模型升级“自研 AI 多模态大模型”2024-05-13 19:17:08
- 消息称联发科将携手英伟达开发 ARM 架构 AI PC 处理器,有望下月公布合作细节2024-05-13 08:04:04
- 有望成为英特尔下代独显首发 GPU ,bmg_g21 核心率先现身 LLVM 更新2024-05-13 09:27:39
- 华为政企部领导莅临开普云交流AI大模型一体机2024-05-12 11:34:28
- 微软打破 Decoder-Only 架构:大幅降低 GPU 内存需求2024-05-11 23:28:49
- 1对话李开复:中美大模型差距越来越小,我10年不“套现”|钛媒体AGI
- 2解锁商业AI,赋能新质生产力发展——思爱普中国峰会探展全纪录
- 3【生态环境周观察】中美就气候问题进行会谈;微软签署史上最大绿色能源协议;隆基刷新单结晶硅光伏电池转换效率世界纪录
- 4成都高新区“虚拟综窗”助力成渝两地“高效办成一件事”
- 5不需要所有的Biotech都活下来
- 6行业裁员背后,全球却掀起芯片人才争夺战
- 7浪潮信息发布2024生态伙伴策略:协同共生,释放AI创新力
- 8君实生物等在安徽成立投资基金 出资额1.61亿
- 9一年烧钱60亿,资本投不出“万店”线下健身房
- 10长安汽车不“传统”,朱华荣亲自上场“卷流量”|钛度车库