最近,Facebook 开源了目前世界上最大的多语言语音数据集,VoxPopuli:这一数据集共涵盖了 23 种语言,时长超过 40 万小时。其中,每种语言都有 9000 到 18000 小时的无标签语音数据。此外,还包括了共 1800 小时,16 种语言的转录语音数据,以及 17300 小时,15 种目标语言的口译语音数据。国外网友很快为这一行为点赞:显然,如果数据集已经存在,那么它应该被利用,并以一种道德的方式来改善人类社会。这一数据集庞大的无标签数据量和广泛的语言覆盖率,对改进自监督模型有着很大的帮助。而 Facebook 也希望能够帮助提高语音数据集的质量和鲁棒性,使训练语音转换神经网络更加可靠。最终加速新的 NLP 系统的开发,使 AI 翻译的效果越来越好。而数据集的名字,VoxPopuli 的直译“人民的心声”也表示了其原始数据的来源 ——即源语音全都收集自 2009-2020 年欧洲议会的活动录音。来自 10 年欧
世界最大的多语言语音数据集现已开源:超 40 万小时,共 23 种语言
2021-08-06 14:25:42来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- TikTok 正开发 AI 语音克隆功能,只需 10 秒即可复制你的音色2024-04-20 18:48:23
- 开源模型打败 GPT-4:LLM 竞技场最新战报,Cohere Command R + 上线2024-04-20 20:26:06
- 云鲸发布逍遥 001 全智能清洁机器人:双目 AI 系统、内置 NarGPT 语音助手,4999 元起2024-04-19 16:48:18
- 最强开源大模型来了,Meta推出开源大模型Llama 3,追赶GPT-42024-04-19 15:21:15
- Meta震撼发布Llama 3,一夜重回开源大模型铁王座2024-04-19 07:57:49
- 无需语音唤醒词,谷歌 Pixel 平板测试 Look and Sign 功能:可用手势交互2024-04-18 14:21:11
- 中国电信开源 TeleChat-12B 星辰语义大模型,年内开源千亿级参数大模型2024-04-16 20:47:46
- 百度李彦宏称开源 AI 模型会越来越落后2024-04-16 11:12:47
- 融合 ChatGPT+DALL・E 3,贾佳亚团队新作开源畅玩:识图推理生图一站解决2024-04-15 16:07:17
- 改进 Markdown 格式显示,华为鸿蒙全新小艺“智慧语音”App 获推 12.1.3.400 众测更新2024-04-15 17:49:41