Prompt tuning,作为 NLP 领域中的一个“新宠”,甚至曾被学者誉为 NLP 预训练新范式。那么,它能否借鉴到 CV 领域并产生同样的成绩呢?现在,来自康奈尔大学和 Meta AI 等机构,通过 Prompt 来调整基于 Transformer 的视觉模型,结果发现:完全可以!比起全面微调,Prompt 性能提升显著。无论模型的规模和训练数据怎么变,24 种情况中有 20 种都完全胜出。与此同时,它还能大幅降低每项任务所需的存储成本。只使用不到 1% 的模型参数大家一贯使用的全面微调(full fine-tuning),需要为每个下游任务存储和部署单独的主干参数副本,成本太高,尤其是现在基于 Transformer 的模型越来越大,已经超过 CNN 架构。所谓 Prompt,最初指的是在输入文本中预编语言指令,以便预培训的语言模型后续可以直接理解各种下游任务。它曾让 GPT-3 即使在少样本或零样本的情况下表现出很强
训练 CV 模型新思路来了:用 NLP 大火的 Prompt 替代微调,性能全面提升
2022-03-25 18:41:39来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 新版机动车驾驶培训教学与考试大纲发布,增加新能源汽车技术及使用常识等2022-03-25 18:25:10
- 业内消息称网络设备芯片和零部件短缺情况将在下半年缓解2022-03-25 18:32:13
- 民航局:东航客机黑匣子数据下载和分析工作目前还不能确定时间2022-03-25 18:33:34
- 苹果 HomePod mini 智能音箱在比利时、荷兰和瑞士正式开售2022-03-25 18:55:46
- B站搜索又崩了,官方回应:正在紧急修复2022-03-25 19:04:23
- 物理开挂,华为 P50 系列 5G 手机壳再曝光2022-03-25 19:14:34
- Epic 开启春季特卖:《无主之地 3》二五折,《赛博朋克 2077》五折2022-03-25 19:35:15
- 小米 12 Lite 手机现身 Geekbench 跑分网站:搭载骁龙 778G 芯片,预装安卓 122022-03-25 19:42:27
- 深天马:第 6 代柔性 OLED 产线刚进入试生产期,预计年底实现量产2022-03-25 19:43:27
- 微信安卓版 8.0.21 内测版发布,官方公布开发者内容更新2022-03-25 19:53:12
- 1瑞士信息与通信科技公司Assaia International研发AI视觉识别软件,提高机场空侧运营周转效率 | 瑞士创…
- 2成都都市圈投资机会清单发布,拟投资金额超过8400亿元
- 3上海试点智能网联汽车等跨境数据传输
- 4京东运动式做内容,能大力出奇迹么?
- 5上海启动首批国资国企区块链创新应用场景建设
- 6盛和资源:公司全资子公司晨光稀土拟收购STA公司全资子公司SRUL公司100%股权
- 7乔治白:监事会主席李富华的配偶短线交易公司股票
- 8贝恩资本计划未来5年内将其在日本投资规模翻番
- 9上海市经信委主任:将加快开源人形机器人原型机研发
- 10中外歌手“乐坛论剑”,《歌手2024》到底比的是什么?