缺数据不是问题,直接用 GPT-4 生成的指令就够了,标注员恐怕要失业了!「指令」(Instruction)是 ChatGPT 模型取得突破性进展的关键因素,可以让语言模型的输出更符合「人类的偏好」。但指令的标注工作需要耗费大量的人力,即便有了开源的语言模型,资金不足的学术机构、小公司也很难训练出自己 ChatGPT.最近微软的研究人员利用之前提出的 Self-Instruct 技术,首次尝试使用 GPT-4 模型来自动生成语言模型所需的微调指令数据。论文链接:https://arxiv.org/ pdf / 2304.03277.pdf代码链接:https://github.com/Instruction-Tuning-with-GPT-4 / GPT-4-LLM在基于 Meta 开源的 LLaMA 模型上的实验结果表明,由 GPT-4 生成的 5.2 万条英语和汉语 instruction-following 数据在新任务中
轻松打造家用版 GPT-4,微软开源微调指令集:效果不输原版,中英双语都能用
2023-04-14 12:23:06来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 豪掷 40 亿欧元,微软在法国最大投资官宣落地 AI 领域2024-05-13 17:20:33
- 给文字动画注入语义灵魂!港科大开源「文字跳动」技术,每个单词都浪漫2024-05-13 18:09:54
- 微软 Edge 浏览器将迎来“智能打印”功能:让打印告别烦人广告和杂乱内容2024-05-13 18:16:07
- 【生态环境周观察】中美就气候问题进行会谈;微软签署史上最大绿色能源协议;隆基刷新单结晶硅光伏电池转换效率世界纪录2024-05-13 14:26:35
- 前暴雪总裁 Ybarra 喊话微软 Xbox:应将重心转移到制作优秀游戏上2024-05-12 15:22:41
- 微软前高级公关经理:XGP 可持续发展的“唯一机会”是纳入《GTA 6》等大作2024-05-12 18:31:35
- 微软因 Cortana 专利侵权被判赔偿 2.42 亿美元2024-05-12 19:04:49
- 微软Xbox移动商店将上线,公开撬苹果、谷歌的墙脚?2024-05-12 08:32:22
- 微软打破 Decoder-Only 架构:大幅降低 GPU 内存需求2024-05-11 23:28:49
- 微软向 Rust 基金会捐赠 100 万美元:投资关键项目、减轻工程师工作压力2024-05-12 11:41:21
- 1对话李开复:中美大模型差距越来越小,我10年不“套现”|钛媒体AGI
- 2【生态环境周观察】中美就气候问题进行会谈;微软签署史上最大绿色能源协议;隆基刷新单结晶硅光伏电池转换效率世界纪录
- 3解锁商业AI,赋能新质生产力发展——思爱普中国峰会探展全纪录
- 4成都高新区“虚拟综窗”助力成渝两地“高效办成一件事”
- 5长安汽车不“传统”,朱华荣亲自上场“卷流量”|钛度车库
- 6一年烧钱60亿,资本投不出“万店”线下健身房
- 7不需要所有的Biotech都活下来
- 8行业裁员背后,全球却掀起芯片人才争夺战
- 9浪潮信息发布2024生态伙伴策略:协同共生,释放AI创新力
- 10君实生物等在安徽成立投资基金 出资额1.61亿