IT之家 5 月 1 日消息,本周早些时候,Mozilla 宣布其 Common Voice 数据集现在包含超过 20000 小时的内容,世界各地的任何人都可以使用这些内容来改进他们的语音识别软件,几乎是一年前的两倍。IT之家了解到,最新的英语数据集有 71 GB,支持的语言也比以往任何时候都多,增加了蒂格雷语、闽南语、Meadow Mari、孟加拉语、道本语和粤语。根据 Mozilla 的说法,Common Voice 项目允许任何人为项目贡献自己的声音,从而让虚拟助手能够理解更多的口音。此外,Common Voice 项目是开源的,可确保大型科技公司无法独占,为小型开发商和公司提供了构建竞争产品和服务的机会。Mozilla 在最新数据集版本中指出的亮点如下:6 种新语言:蒂格雷语、闽南语、Meadow Mari、孟加拉语、道本语和粤语。27 种语言至少有 100 小时的语音数据,包括孟加拉语、泰语、巴斯克语和弗里斯兰语。9
Mozilla 开源语音数据集已拥有超两万小时内容,新增支持粤语、闽南语
2022-05-01 14:47:34来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- TikTok 正开发 AI 语音克隆功能,只需 10 秒即可复制你的音色2024-04-20 18:48:23
- 开源模型打败 GPT-4:LLM 竞技场最新战报,Cohere Command R + 上线2024-04-20 20:26:06
- 云鲸发布逍遥 001 全智能清洁机器人:双目 AI 系统、内置 NarGPT 语音助手,4999 元起2024-04-19 16:48:18
- 最强开源大模型来了,Meta推出开源大模型Llama 3,追赶GPT-42024-04-19 15:21:15
- Meta震撼发布Llama 3,一夜重回开源大模型铁王座2024-04-19 07:57:49
- 无需语音唤醒词,谷歌 Pixel 平板测试 Look and Sign 功能:可用手势交互2024-04-18 14:21:11
- 中国电信开源 TeleChat-12B 星辰语义大模型,年内开源千亿级参数大模型2024-04-16 20:47:46
- 百度李彦宏称开源 AI 模型会越来越落后2024-04-16 11:12:47
- 融合 ChatGPT+DALL・E 3,贾佳亚团队新作开源畅玩:识图推理生图一站解决2024-04-15 16:07:17
- 改进 Markdown 格式显示,华为鸿蒙全新小艺“智慧语音”App 获推 12.1.3.400 众测更新2024-04-15 17:49:41
- 1小米汽车 SU7 广告横幅占领 2024 北京车展大门
- 2Canalys:2024 年一季度华为重夺中国大陆智能手机市场第一
- 3特斯拉回击投资者对马斯克薪酬方案的反对意见
- 4安踏0碳使命店开幕;VICUTU威可多30周年品牌升级首倡“正装全场景”;太平鸟品牌VI升级;方里官宣梅耶·马斯克|消…
- 5用5G制造5G!新浪科技带你逛中兴通讯云网生态峰会
- 6全新电动 MINI COOPER 开启预售:3 款车型,21 万-27 万元
- 7凯西·伍德的ARK基金遭遇投资者大规模撤资
- 8魅蓝 OpenBlus 2 开放式蓝牙耳机发布:外观采用贝形设计,169 元
- 9北京:对采购自主可控GPU芯片开展智能算力服务的企业,按照投资额的一定比例给予支持
- 10Prada集团一季度收益净额11.87亿欧元,亚太区零售销售同比增加16%