微比恩 > 信息聚合 > AI 变鉴片大师，星际穿越都能看懂！贾佳亚团队新作，多模态大模型挑战超长 3 小时视频

AI 变鉴片大师，星际穿越都能看懂！贾佳亚团队新作，多模态大模型挑战超长 3 小时视频

2023-12-10 15:39:24来源: IT之家

AI 变鉴片大师，星际穿越都能看懂！贾佳亚团队新作，多模态大模型挑战超长 3 小时视频

图片地址：https://img.ithome.com/newsuploadfiles/2023/12/fa90e7e7-97e3-43bd-8bcd-1fe8f9b2e8b5.png?x-bce-process=image/format,f_auto

啥？AI 都能自己看电影大片了？贾佳亚团队最新研究成果，让大模型直接学会了处理超长视频。丢给它一部科幻大片《星际穿越》（片长 2 小时 49 分钟）：它“看”完之后，不仅能结合电影情节和人物轻松对电影进行点评：还能很精准地回答出剧中所涉的细节：例如：虫洞的作用和创造者是谁？答：未来的智慧生物放置在土星附近，用于帮助人类进行远距离星际穿越。男主库珀是如何将黑洞中的信息传递给女儿墨菲？答：通过手表以摩斯密码的方式传递数据。啊这，感觉电影博主的饭碗也要被 AI 抢走了。这就是最新多模态大模型 LLaMA-VID，它支持单图、短视频和长视频三种输入。对比来看，包括 GPT-4V等在内的同类模型基本只能处理图像。而背后原理更有看头。据介绍，LLaMA-VID 只通过一个非常简单的办法就达成了如上能力，那就是：把表示每一帧图像的 token 数量，压缩到仅有 2 个。具体效果如何以及如何实现？一起来看。人物理解分析、电影细节都 OK对于电影

关注公众号

标签： AI 视频大模型

提示：支持键盘“← →”键翻页

上一篇宾利与杜卡迪合作推出 Diavel 限量版摩托车，仅生产 500 辆

下一篇用牛粪提取的甲烷做燃料：日本一初创航天公司成功测试火箭发动机原型

赞

你的鼓励是对作者的最大支持

相关阅读

OpenAI惊天内幕曝光！高管怒斥遭打压，7100亿AI巨头内外交困｜钛媒体AGI2024-05-19 08:20:08
瑞士信息与通信科技公司Assaia International研发AI视觉识别软件，提高机场空侧运营周转效率 | 瑞士创…2024-05-19 17:45:33
OpenAI回应“封嘴”离职条款：从未回收过任何员工股权2024-05-19 15:48:08
限购 1 件 1389 元：苹果 AirPods Pro 第二代耳机京东新低2024-05-19 10:52:56
日本东京地方法院驳回 AI“发明”专利申请：发明人仅限于人类2024-05-19 16:33:26
自己声音被拿来训练 AI，美国两位配音演员对初创公司 Lovo 提起诉讼2024-05-19 17:43:18
育碧 CEO：将使用 AI 技术开发更有活力、更丰富的游戏2024-05-19 18:38:16
古尔曼：代号“B589”的苹果新款 AirTag 2025 年中发布，全线 Mac 产品明年更新至 M4 芯片2024-05-19 21:57:10
古尔曼：苹果在 AI 时代需要进化，错误地区分了 iPad 与 Mac 产品，Vision Pro 将仰仗亚洲市场表现2024-05-19 22:33:30
UCSD 新作：OpenAI GPT-4 通过图灵测试，54% 几率被判定为人类2024-05-18 17:51:51

热门排行榜

1日1周1月

免费发布分类信息

最新图片