大神卡帕西(Andrej Karpathy)刚“复工”,立马带来神作:纯 C 语言训练 GPT,1000 行代码搞定!,不用现成的深度学习框架,纯手搓。发布仅几个小时,已经揽星 2.3k。它可以立即编译和运行,和 PyTorch 完全兼容。卡帕西使用的示例是 GPT-2,但 Llama 2 和 Gemma 等也适用。项目发布后,他还给出了从 PyTorch 迁移到 C 的教程。网友们直呼:他甚至都不用 C++……而且就连怎么让大模型如法炮制的提示词,他也放了出来。现在已经有人在用 Devin 尝试 ing。手动实现每个层前向 / 反向传播选择用 GPT-2 的原因很简单,有模型权重,采用了堆栈式的 Transformer 模型结构。项目核心的重点包括:直接在 C / CUDA 上训练 LLM,速度接近 PyTorch通过在 CPU 版本中使用 SIMD 指令(如 AVX2 和 NEON)聊加速 CPU 版本支持更先进的架构,比如
OpenAI 创始大神手搓千行 C 代码训练 GPT,附 PyTorch 迁移教程
2024-04-09 22:19:39来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 华为官宣夏季新品发布会,AI PC仍是最大主角2024-05-09 17:23:24
- 35分钟的iPad发布会里,苹果为何句句都离不开AI?2024-05-09 17:29:10
- 传软银正洽谈收购一家AI芯片初创公司 曾被冀望成为“英国英伟达”2024-05-09 17:29:15
- Yellow.ai 推出业界首款 Orchestrator LLM2024-05-09 03:07:00
- Rainbow Robotics开启移动双臂机器人RB-Y1预售,售价80000美元2024-05-09 08:00:00
- WILDBRAIN CPLG 在上海举办特许经营峰会2024-05-09 09:00:00
- SK 海力士宣布开发出新一代移动端 NAND 闪存解决方案“ZUFS 4.0”,今年第三季度量产并搭载于端侧 AI 手机2024-05-09 08:17:11
- 消息称 OpenAI 挖角谷歌员工开发 AI 搜索引擎2024-05-09 08:31:22
- 消息称马斯克旗下 xAI 最快本周完成融资,估值 180 亿美元2024-05-09 08:47:57
- OpenAI 推出 Model Spec 拟议框架,探索生成 NSFW 内容等 AI 响应规范2024-05-09 08:58:47
- 1全球平板电脑市场恢复增长,华为加速扩张、苹果保持领先 | 钛媒体焦点
- 2妙鸭前负责人张月光新项目:连续完成三轮融资,估值过亿美金 | 36氪独家
- 3大名城:拟出资8800万元参设福建省大数据智算投资有限公司
- 4氪星晚报|拼多多获国内多地快递驿站经营许可证;英国自动驾驶企业Wayve获75亿元融资;央行连续第18个月增持黄金储备
- 5科技昨夜今晨 0508:特斯拉或启动新一轮裁员;淘宝网页版宣布完成重要升级;8999 元起,2024 款苹果 iPad …
- 6锦江成立度假公寓事业部、哈工智灵完成天使轮融资、前理想汽车总裁创立智能住宅品牌 "栖息地 " 获 6.53 亿元融资 |…
- 7“中腾微网”完成近亿元B轮融资
- 8“瑞初医药”完成上亿元Pre-A轮融资
- 9提供工业AI生成式设计软件,「设序科技」完成近亿元A+轮融资|融资首发
- 102024 款华为 MateBook 14 笔记本海外发布:2.8K OLED 触控屏、支持 M-Pencil 手写笔