微比恩 > 信息聚合 > Meta 推出 V-JEPA 模型,利用 AI 高效补充视频受遮蔽部分

Meta 推出 V-JEPA 模型,利用 AI 高效补充视频受遮蔽部分

2024-02-17 19:55:37来源: IT之家

IT之家 2 月 17 日消息,Meta 首席 AI 科学家 Yann LeCun 在 2022 年推出了 JEPA(Joint Embedding Predictive Architectures)模型架构,次年基于 JEPA 架构开发了一款“I-JEPA”图片预测模型,目前又推出了一款名为“V-JEPA”的视频预测模型。据介绍,相关 JEPA 架构及 I-JEPA / V-JPA 模型主打“预测能力”,号称可以以“人类理解”的方式,利用抽象性高效预测生成图片 / 视频中被遮蔽的部分。IT之家注意到,研究人员使用一系列经过遮蔽处理的特定视频训练 I-JEPA / V-JEPA 模型,研究人员要求模型利用“抽象方式”填充视频中缺失的内容,从而让模型在填充间学习场景,进一步预测未来的事件或动作,进而达到对世界更深层次的理解。▲ 图源 Meta 官方新闻稿(下同)研究人员表

关注公众号
标签: AI 视频 Meta