微比恩 > 信息聚合 > 世界最大的多语言语音数据集现已开源：超 40 万小时，共 23 种语言

世界最大的多语言语音数据集现已开源：超 40 万小时，共 23 种语言

2021-08-06 14:25:42来源: IT之家

世界最大的多语言语音数据集现已开源：超 40 万小时，共 23 种语言

图片地址：https://img.ithome.com/newsuploadfiles/2021/8/09cb1acd-1ebc-4e25-bf28-ca94f110fc0d.png

最近，Facebook 开源了目前世界上最大的多语言语音数据集，VoxPopuli：这一数据集共涵盖了 23 种语言，时长超过 40 万小时。其中，每种语言都有 9000 到 18000 小时的无标签语音数据。此外，还包括了共 1800 小时，16 种语言的转录语音数据，以及 17300 小时，15 种目标语言的口译语音数据。国外网友很快为这一行为点赞：显然，如果数据集已经存在，那么它应该被利用，并以一种道德的方式来改善人类社会。这一数据集庞大的无标签数据量和广泛的语言覆盖率，对改进自监督模型有着很大的帮助。而 Facebook 也希望能够帮助提高语音数据集的质量和鲁棒性，使训练语音转换神经网络更加可靠。最终加速新的 NLP 系统的开发，使 AI 翻译的效果越来越好。而数据集的名字，VoxPopuli 的直译“人民的心声”也表示了其原始数据的来源 ——即源语音全都收集自 2009-2020 年欧洲议会的活动录音。来自 10 年欧

关注公众号

标签：语音开源

提示：支持键盘“← →”键翻页

上一篇对话节目《雷军请你超大杯》将于 10 日播出，首期邀请孟京辉导演

下一篇上海市消保委调查发现：33.3% 网络平台预订酒店的价格更贵

赞

你的鼓励是对作者的最大支持

相关阅读

TikTok 正开发 AI 语音克隆功能，只需 10 秒即可复制你的音色2024-04-20 18:48:23
开源模型打败 GPT-4：LLM 竞技场最新战报，Cohere Command R + 上线2024-04-20 20:26:06
云鲸发布逍遥 001 全智能清洁机器人：双目 AI 系统、内置 NarGPT 语音助手，4999 元起2024-04-19 16:48:18
最强开源大模型来了，Meta推出开源大模型Llama 3，追赶GPT-42024-04-19 15:21:15
Meta震撼发布Llama 3，一夜重回开源大模型铁王座2024-04-19 07:57:49
无需语音唤醒词，谷歌 Pixel 平板测试 Look and Sign 功能：可用手势交互2024-04-18 14:21:11
中国电信开源 TeleChat-12B 星辰语义大模型，年内开源千亿级参数大模型2024-04-16 20:47:46
百度李彦宏称开源 AI 模型会越来越落后2024-04-16 11:12:47
融合 ChatGPT+DALL・E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决2024-04-15 16:07:17
改进 Markdown 格式显示，华为鸿蒙全新小艺“智慧语音”App 获推 12.1.3.400 众测更新2024-04-15 17:49:41

热门排行榜

1日1周1月

免费发布分类信息

最新图片