IT之家 2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。亚马逊团队还测试了使用较小数据集的模型,希望
亚马逊开发出有史以来最大的文本转语音模型,展现“涌现能力”
2024-02-18 11:58:52来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 亚马逊云科技推出业内首个生成式AI合作伙伴能力认证2024-04-23 11:31:00
- TikTok 正开发 AI 语音克隆功能,只需 10 秒即可复制你的音色2024-04-20 18:48:23
- 云鲸发布逍遥 001 全智能清洁机器人:双目 AI 系统、内置 NarGPT 语音助手,4999 元起2024-04-19 16:48:18
- Meta Llama 3基础模型现已在亚马逊云科技正式可用2024-04-19 15:16:00
- 无需语音唤醒词,谷歌 Pixel 平板测试 Look and Sign 功能:可用手势交互2024-04-18 14:21:11
- 西门子中国与亚马逊云科技签署战略合作协议2024-04-18 10:30:00
- 亚马逊要花钱买未来2024-04-17 19:03:44
- 华通证券国际于亚马逊云科技产业大会发布AI新品2024-04-15 18:12:00
- 改进 Markdown 格式显示,华为鸿蒙全新小艺“智慧语音”App 获推 12.1.3.400 众测更新2024-04-15 17:49:41
- 【零售流通周报】马云发声:阿里最核心的变化是重回客户价值轨道;美团外卖调整架构,撤销直营业务部;亚马逊将裁员数百人;快手…2024-04-14 20:23:09
- 1依托于“天通一号”,比亚迪与中国电信联合推出汽车直连卫星业务
- 2用回iPhone 5c后,我怀念起那个把塑料做出高端感的时代
- 3雷军、谷歌、联想、甲骨文……F1 为什么成了科技圈春晚?
- 4全文|微软Q3业绩会实录:有信心将投资转化为未来的第二次成功
- 5射击游戏《逃离塔科夫》推出 The Unheard 版:专属 PvE 模式,250 美元
- 6消息称 OPPO XR 探索暂停,转向 AI Device、机器人
- 7科林电气vs海信网能:资本市场并购浪潮渐起
- 89点1氪|周鸿祎辟谣进军汽车行业;恒大地产欠税752万元被公告;黄金变现火爆,业内人士提醒投资者需谨慎
- 9Sensor Tower:39 家中国厂商入围 3 月全球手游发行商收入榜 TOP100,合计吸金 21.3 亿美元
- 10团结引擎亮相北京车展,Unity中国持续引领智能出行生态