IT之家 11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。IT之家附上论文参考地址:Rongliang Wu, Yingchen Yu, Fangneng Zh
科学家开发 DIRFA:输入图片和音频,可生成说话视频
2023-11-17 11:25:37来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 微软 Win11 截图工具实用更新:自带视频编辑,录屏剪切一气呵成2025-02-22 11:41:36
- 微软 Copilot 新技能:背靠 500 万 Clipchamp 素材库,秒速生成 AI 视频2025-02-22 15:53:49
- “大模型六虎”阶跃星辰3月将开源图生视频模型,并成立新的生态基金|钛媒体AGI2025-02-21 23:32:16
- 苹果推出全新沉浸式视频:Vision Pro 带你北极冲浪2025-02-21 21:46:19
- OPPO Find N5 折叠屏手机支持杜比视界 HDR 视频拍摄、播放2025-02-20 22:16:02
- 蔚来 ET9 轿车“挑战 150+km/h 高速直线前后轮爆胎”视频提前发布,李斌邀请华为余承东同测2025-02-20 23:02:32
- 6.1 英寸 iPhone 最长续航:苹果 iPhone 16e 视频播放续航 26 小时,比 SE 3 长 73%2025-02-20 00:21:57
- 官方 13 分钟视频剖析 iPhone 16e:自研 5G 基带 C1 首秀、4800 万像素影像实力、A18 芯片,打…2025-02-20 00:56:51
- 微软预告 Teams 三月更新:支持云视频互操作、改善旧款蓝牙耳机续航、升级安全管理2025-02-19 10:01:51
- 亚马逊短视频电商受挫,TikTok 风格网红种草功能 Inspire 熄火2025-02-19 11:13:52