听一遍曲子,就能知道乐谱,还能马上演奏,而且还掌握“十八般乐器”,钢琴、小提琴、吉他等都不在话下。这就不是人类音乐大师,而是谷歌推出的“多任务多音轨”音乐转音符模型 MT3。首先需要解释一下什么是多任务多音轨。通常一首曲子是有多种乐器合奏而来,每个乐曲就是一个音轨,而多任务就是同时将不同音轨的乐谱同时还原出来。事实上,谷歌 MT3 在还原多音轨乐谱这件事上,达到了 SOTA 的结果。谷歌已将该论文投给 ICLR 2022。还原多音轨乐谱相比与自动语音识别 (ASR) ,自动音乐转录 (AMT) 的难度要大得多,因为后者既要同时转录多个乐器,还要保留精细的音高和时间信息。多音轨的自动音乐转录数据集更是“低资源”的。现有的开源音乐转录数据集一般只包含一到几百小时的音频,相比语音数据集动辄几千上万小时的市场,算是很少了。先前的音乐转录主要集中在特定于任务的架构上,针对每个任务的各种乐器量身定制。
谷歌推出全能扒谱 AI:只要听一遍歌曲,钢琴小提琴的乐谱全有了
2022-01-03 12:36:06来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- Amazon Bedrock推出全新功能 助力数万客户构建和扩展安全的生成式AI应用程序2024-04-23 21:56:00
- 正平股份:目前业务收入以基础设施建设为主,不涉及AI算力、大数据业务2024-04-23 20:49:50
- 54位大咖演讲精华! 中国生成式AI大会圆满收官,TOP50企业榜单揭晓2024-04-23 15:37:01
- 消息称索尼 ZV-E10Ⅱ 相机 5 月发布,加入 AI 技术的 A6700 简化版2024-04-23 16:49:11
- TrendForece:AI 推理带动今年企业级 QLC 固态硬盘出货容量增长四倍2024-04-23 17:38:34
- Adobe Photoshop 引入全新 Firefly Image 3 图像 AI 模型,Beta 版开放下载2024-04-23 18:49:01
- 极星手机 Polestar Phone 发布:主打“AI + 车联”,7388 元2024-04-23 19:57:36
- 新增会员 AI 助手功能,锤子便签应用安卓版获推 v4.0 正式版更新2024-04-23 20:11:43
- 亚马逊云科技推出业内首个生成式AI合作伙伴能力认证2024-04-23 11:31:00
- 广州领芯RAID卡与浪潮信息云峦KeyarchOS完成澎湃技术认证2024-04-23 11:59:00