微比恩 > 信息聚合 > 谷歌 10 秒视频生成模型 VideoPoet 破世界记录!LLM 终结扩散模型,效果碾压顶流 Gen-2

谷歌 10 秒视频生成模型 VideoPoet 破世界记录!LLM 终结扩散模型,效果碾压顶流 Gen-2

2023-12-20 23:32:41来源: IT之家

谷歌全新视频生成模型 VideoPoet 再次引领世界!十秒超长视频生成效果碾压 Gen-2,还可进行音频生成,风格转化。AI 视频生成,或许就是 2024 年下一个最前沿(juan)的领域。回看过去几个月,RunWay 的 Gen-2、Pika Lab 的 Pika 1.0,国内大厂等大波视频生成模型纷纷涌现,不断迭代升级。这不,RunWay 一大早就宣布 Gen-2 支持文本转语音的功能了,可以为视频创建画外音。当然,谷歌在视频生成上也不甘落后,先是与斯坦福李飞飞团队共同发布了 W.A.L.T,用 Transformer 生成的逼真视频引来大波关注。今天,谷歌团队又发布了一个全新的视频生成模型 VideoPoet,而且无需特定数据便可生成视频。论文地址:https://blog.research.google/ 2023/12 / videopoet-large-language-model-for-zero.html最令人

关注公众号
标签: 谷歌