近日,谷歌AI研究人员提出了一种称为LaBSE的多语言BERT嵌入模型,该模型可为109种语言生成与语言无关的跨语言句子嵌入。这一论文题目为「Language-agnostic BERT Sentence Embedding」,目前已在arxiv上发表。论文地址:https://arxiv.org/pdf/2007.01852.pdf研究背景多语言嵌入模型是一种功能强大的工具,可将不同语言的文本编码到共享的嵌入空间中,从而使其能够应用在一系列下游任务,比如文本分类、文本聚类等,同时它还利用语义信息来理解语言。用于生成此类嵌入的现有方法如LASER或m~USE依赖并行数据,将句子从一种语言直接映射到另一种语言,鼓励句子嵌入之间的一致性。尽管这些现有的多语言嵌入方法可在多种语言中有良好的整体性能,但与专用双语模型相比,它们在高资源语言上通常表现不佳。此外,由于有限的模型容量、低资源语言的训练数据质量通常较差,可能难以扩展多语言模型以
谷歌提出多语言BERT模型:可为109种语言生成与语言无关的跨语言句子嵌入
2020-08-20 13:15:05来源: 新浪科技
关注公众号
赞
你的鼓励是对作者的最大支持
- AI 预测蝴蝶效应?谷歌最新天气预报模型 SEEDS 登 Science 子刊2024-05-01 14:47:15
- 微软内部邮件泄密:为追赶谷歌 AI,巨额投资 OpenAI2024-05-01 22:49:59
- 谷歌 Pixel 8a 手机有望可选 128/256GB 存储空间版本,售 499 美元起2024-04-30 20:29:09
- 利用山寨谷歌 Chrome 浏览器传播,安全公司披露安卓平台勒索木马 Brokewell2024-04-30 19:08:01
- 谷歌 Pixel 8a 手机可选 128/256GB 存储空间版本,售 499 美元起2024-04-30 20:29:09
- 谷歌证实正进行内部裁员,影响 Python / Flutter / Dart 等团队 50 余名员工2024-04-30 21:42:19
- 推三阻四,谷歌第三方Cookie全面淘汰计划年内无望,对国内数字营销行业有何影响?2024-04-28 20:48:36
- 消息称谷歌 Python 基础团队全数被裁2024-04-28 18:54:10
- 谷歌要求法院驳回美国司法部指控其垄断广告技术的诉讼2024-04-28 07:48:36
- 跻身第四大,谷歌母公司 Alphabet 站稳加入“2 万亿美元俱乐部”2024-04-28 11:14:03
- 1全文|亚马逊Q1业绩会实录:今年资本支出将大幅增加 特别是AI方面
- 2哈啰出行在扬州成立新公司 注册资本1000万
- 3微软宣布将在印尼投资 17 亿美元,大力发展人工智能和云计算
- 4对话蔚来李斌:ET7要攻克BBA的核心“堡垒”|钛度车库
- 5上汽通用汽车4月新能源车型交付8762辆
- 6没了预售,618“拼”什么?
- 7联想 Thinkplus LP42 TWS 耳机发售:蓝牙 5.4、30 小时续航,89 元
- 8深交所:将创业板定位评价标准中的营业收入复合增长率指标由20%适度提高至25%
- 9东航物流成立冷链物流公司 注册资本3亿
- 10珠海:到2027年,工业领域设备投资规模较2023年翻一倍