在视频扩散生成领域,如何精准操控视频中的运动细节而又不牺牲画面质量,一直是研究者共同追逐的目标。来自 Neflix、Stony Brook 大学等机构的研究人员创新性地提出通过结构化的潜在噪声采样控制运动。实现方法很简单,只要对训练视频做预处理,生成结构化噪声。这一过程不涉及扩散模型的设计,无需改变其架构和训练流程。研究提出了一种全新的噪声扭曲算法,速度超快,能实时运行。它用光流场推导的扭曲噪声,取代随机的时序高斯噪声,同时保持了空间高斯性。由于算法高效,能用扭曲噪声以极小的成本微调视频扩散基础模型。这为用户提供了全面的运动控制方案,可用于局部物体运动控制、全局摄像机运动控制以及运动迁移等场景。此外,算法兼顾了扭曲噪声的时序一致性和空间高斯性,既能保证每帧画面的像素质量,又能有效控制运动。论文链接:https://arxiv.org/pdf/2501.08331本研究的贡献如下:创新的视频扩散模型解决方案:提出一种简单新颖的方法
一拖一拽小猫“活了”,Netflix 等噪声扭曲算法让运动控制更简单
2025-02-03 21:37:49来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 火狐 Firefox 浏览器 135 桌面版发布2025-02-03 21:50:02
- 苹果 Apple Music“音乐回忆 2025”歌单上线,每周更新收录用户常听歌曲2025-02-03 22:28:09
- Nothing Phone(3a)系列手机侧面配“神秘按钮”,有望支持唤醒 AI 或进行快速拍摄2025-02-03 22:33:55
- 《哪吒之魔童闹海》进入中国影史票房前 10:含预售总票房突破 41 亿,有望冲击第一2025-02-03 22:36:36
- 《文明 7》全球媒体评测解禁:IGN 7 分“游戏 UI 过度简化、难以上手”2025-02-03 23:00:44
- 连微商都嫌弃玛莎拉蒂了2025-02-03 15:51:00
- 国家知识产权局:2024 年我国企业有效发明专利产业化率达 53.3%,连续 5 年增长2025-02-02 15:45:51
- 好评率仅 58%,《漫威蜘蛛侠 2》成 Steam 平台索尼第一方评价最低游戏2025-02-02 15:53:35
- 中央广播电视总台:已启动专项行动,将打击侵犯哈尔滨亚冬会版权及利用节目资源的不正当竞争行为2025-02-02 15:58:41
- 支持 DLSS4 / 多帧生成功能,游戏《心灵杀手 2》更新适配英伟达 RTX50 系列显卡2025-02-02 16:09:19
- 1法国 AI 产业将迎 1090 亿欧元私人投资,阿联酋有望独揽其中 500 亿欧元
- 2奥浦迈欲吞下澎立生物,CXO小规模企业开始“抱团取暖”丨并购一线
- 3DeepSeek技术解析:如何冲击英伟达两大壁垒?
- 4再次反转,美国取消小包裹关税,低价策略或将走进死胡同?
- 5人机共生,谁在为谁供能?
- 6Nuuva V300 混合电动垂直起降飞行器完成首次悬停测试,将用于远程货物运输
- 7岚图梦想家将推出“售价不到 40 万元”新汽车版型,配备华为乾崑智驾
- 8受 PSN 宕机影响,卡普空宣布《怪物猎人:荒野》PS5 版第二次公测将延长 24 小时
- 9Flyme AIOS 确认接入 DeepSeek-R1 大模型,魅族 21 系列下周起上线
- 10下沉市场里,贵妇们找到了自己的迪士尼