微比恩 > 信息聚合 > OpenAI 创始大神手搓千行 C 代码训练 GPT，附 PyTorch 迁移教程

OpenAI 创始大神手搓千行 C 代码训练 GPT，附 PyTorch 迁移教程

2024-04-09 22:19:39来源: IT之家

OpenAI 创始大神手搓千行 C 代码训练 GPT，附 PyTorch 迁移教程

图片地址：https://img.ithome.com/newsuploadfiles/2024/4/84630cec-bd54-424a-8a35-0021f17d4565.png?x-bce-process=image/format,f_auto

大神卡帕西（Andrej Karpathy）刚“复工”，立马带来神作：纯 C 语言训练 GPT，1000 行代码搞定！，不用现成的深度学习框架，纯手搓。发布仅几个小时，已经揽星 2.3k。它可以立即编译和运行，和 PyTorch 完全兼容。卡帕西使用的示例是 GPT-2，但 Llama 2 和 Gemma 等也适用。项目发布后，他还给出了从 PyTorch 迁移到 C 的教程。网友们直呼：他甚至都不用 C++……而且就连怎么让大模型如法炮制的提示词，他也放了出来。现在已经有人在用 Devin 尝试 ing。手动实现每个层前向 / 反向传播选择用 GPT-2 的原因很简单，有模型权重，采用了堆栈式的 Transformer 模型结构。项目核心的重点包括：直接在 C / CUDA 上训练 LLM，速度接近 PyTorch通过在 CPU 版本中使用 SIMD 指令（如 AVX2 和 NEON）聊加速 CPU 版本支持更先进的架构，比如

关注公众号

标签： AI OpenAI

提示：支持键盘“← →”键翻页

上一篇 120 亿参数 Stable LM 2 上线即开源：2 万亿 token 训练，碾压 Llama 2 70B

下一篇 TIOBE 发布 4 月编程指数排行榜，PHP 跌至历史最低点

赞

你的鼓励是对作者的最大支持

相关阅读

华为官宣夏季新品发布会，AI PC仍是最大主角2024-05-09 17:23:24
35分钟的iPad发布会里，苹果为何句句都离不开AI？2024-05-09 17:29:10
传软银正洽谈收购一家AI芯片初创公司曾被冀望成为“英国英伟达”2024-05-09 17:29:15
Yellow.ai 推出业界首款 Orchestrator LLM2024-05-09 03:07:00
Rainbow Robotics开启移动双臂机器人RB-Y1预售，售价80000美元2024-05-09 08:00:00
WILDBRAIN CPLG 在上海举办特许经营峰会2024-05-09 09:00:00
SK 海力士宣布开发出新一代移动端 NAND 闪存解决方案“ZUFS 4.0”，今年第三季度量产并搭载于端侧 AI 手机2024-05-09 08:17:11
消息称 OpenAI 挖角谷歌员工开发 AI 搜索引擎2024-05-09 08:31:22
消息称马斯克旗下 xAI 最快本周完成融资，估值 180 亿美元2024-05-09 08:47:57
OpenAI 推出 Model Spec 拟议框架，探索生成 NSFW 内容等 AI 响应规范2024-05-09 08:58:47

热门排行榜

1日1周1月

免费发布分类信息

最新图片