啥?AI 都能自己看电影大片了?贾佳亚团队最新研究成果,让大模型直接学会了处理超长视频。丢给它一部科幻大片《星际穿越》(片长 2 小时 49 分钟):它“看”完之后,不仅能结合电影情节和人物轻松对电影进行点评:还能很精准地回答出剧中所涉的细节:例如:虫洞的作用和创造者是谁?答:未来的智慧生物放置在土星附近,用于帮助人类进行远距离星际穿越。男主库珀是如何将黑洞中的信息传递给女儿墨菲?答:通过手表以摩斯密码的方式传递数据。啊这,感觉电影博主的饭碗也要被 AI 抢走了。这就是最新多模态大模型 LLaMA-VID,它支持单图、短视频和长视频三种输入。对比来看,包括 GPT-4V等在内的同类模型基本只能处理图像。而背后原理更有看头。据介绍,LLaMA-VID 只通过一个非常简单的办法就达成了如上能力,那就是:把表示每一帧图像的 token 数量,压缩到仅有 2 个。具体效果如何以及如何实现?一起来看。人物理解分析、电影细节都 OK对于电影
AI 变鉴片大师,星际穿越都能看懂!贾佳亚团队新作,多模态大模型挑战超长 3 小时视频
2023-12-10 15:39:24来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- OpenAI惊天内幕曝光!高管怒斥遭打压,7100亿AI巨头内外交困|钛媒体AGI2024-05-19 08:20:08
- 瑞士信息与通信科技公司Assaia International研发AI视觉识别软件,提高机场空侧运营周转效率 | 瑞士创…2024-05-19 17:45:33
- OpenAI回应“封嘴”离职条款:从未回收过任何员工股权2024-05-19 15:48:08
- 限购 1 件 1389 元:苹果 AirPods Pro 第二代耳机京东新低2024-05-19 10:52:56
- 日本东京地方法院驳回 AI“发明”专利申请:发明人仅限于人类2024-05-19 16:33:26
- 自己声音被拿来训练 AI,美国两位配音演员对初创公司 Lovo 提起诉讼2024-05-19 17:43:18
- 育碧 CEO:将使用 AI 技术开发更有活力、更丰富的游戏2024-05-19 18:38:16
- 古尔曼:代号“B589”的苹果新款 AirTag 2025 年中发布,全线 Mac 产品明年更新至 M4 芯片2024-05-19 21:57:10
- 古尔曼:苹果在 AI 时代需要进化,错误地区分了 iPad 与 Mac 产品,Vision Pro 将仰仗亚洲市场表现2024-05-19 22:33:30
- UCSD 新作:OpenAI GPT-4 通过图灵测试,54% 几率被判定为人类2024-05-18 17:51:51