IT之家 11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。谷歌和谷歌 Deepmind 的研究人员提出了新的方法,将多模态理解扩展到长视频领域。借助 Mirasol AI 模型,该团队试图解决两个关键挑战:需要以高频采样同步视频和音频,但要异步处理标题和视频描述。视频和音频会生成大量数据,这会让模型的容量紧张。谷歌在 Mirasol 中使用合路器(combiners)和自回归转换器(autoregressive transformer)模型。该模型组件会处理时间同步的视频和音频信号,然后再将视频拆分为单独的片段。转换器处理每个片段,并学习每个片段之间的联系,然后使用另一个转换器处理上下文文本,这两个组件交换有关其各自输入的信息。名为
谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频
2023-11-16 16:01:12来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 微软Xbox移动商店将上线,公开撬苹果、谷歌的墙脚?2024-05-12 08:32:22
- 谷歌云服务出现罕见重大配置错误事故,澳养老基金 UniSuper 账户被删2024-05-11 14:35:18
- 谷歌推广“圈选即搜”实用功能,Pixel Tablet 平板现已支持2024-05-11 14:46:21
- 十年磨一「图」,谷歌震撼发布纳米级人脑图谱!AI 加持人类大脑研究2024-05-10 20:20:46
- 消息称谷歌 Pixel Watch 不再向用户手机发送“手表充电已满”通知2024-05-11 07:49:02
- 乐视视频回应“《甄嬛传》综艺”播出:非官方授权2024-05-10 16:50:36
- 谷歌搅局AI制药,进击的AlphaFold3模型2024-05-10 15:43:15
- iOS 版谷歌 Chrome 浏览器测试多账户系统,便于用户切换工作、生活账号2024-05-10 10:40:44
- 进度赶超大厂,中国最接近Sora的视频模型出自一家“清华系”公司 | New Things2024-05-09 16:05:41
- AlphaFold 3重磅发布,谷歌开启1000亿刀AI药物研发市场2024-05-09 21:54:50
- 1每天可处理 5600 吨原油,亚洲首艘圆筒型浮式生产储卸油装置“海葵一号”将服役我国首个深水油田
- 2欧洲小国想做锂电一哥:匈牙利缘何成中企投资热土
- 3上海浦东启动“上市公司高质量发展服务月” 将支持上市公司再融资、并购重组
- 4江铃福特新款领睿 / 领裕完成工信部申报,新增插混动力车型
- 5瑞丰达有20位投资经理?公司内部资料显示仅3位
- 6央行:2024年前四个月社会融资规模增量累计为12.73万亿元
- 7假借“维修宽带”名义上门安装电诈专用“黑盒子”,一犯罪嫌疑人被抓
- 8最新 AI GeoSpy 看一眼照片就定位你在哪里,精确到经纬度
- 9方大炭素资本局:账上现金超60亿,盈利三年未分红,却抛40亿购买理财产品
- 10无醇啤酒市场价值超130亿美元,饮料巨头纷纷加码