微比恩 > 信息聚合 > 谷歌提出多语言BERT模型：可为109种语言生成与语言无关的跨语言句子嵌入

谷歌提出多语言BERT模型：可为109种语言生成与语言无关的跨语言句子嵌入

2020-08-20 13:15:05来源: 新浪科技

谷歌提出多语言BERT模型：可为109种语言生成与语言无关的跨语言句子嵌入

图片地址：https://n.sinaimg.cn/sinakd20200820s/482/w900h382/20200820/2a37-iyaiihk3228859.jpg

近日，谷歌AI研究人员提出了一种称为LaBSE的多语言BERT嵌入模型，该模型可为109种语言生成与语言无关的跨语言句子嵌入。这一论文题目为「Language-agnostic BERT Sentence Embedding」，目前已在arxiv上发表。论文地址：https://arxiv.org/pdf/2007.01852.pdf研究背景多语言嵌入模型是一种功能强大的工具，可将不同语言的文本编码到共享的嵌入空间中，从而使其能够应用在一系列下游任务，比如文本分类、文本聚类等，同时它还利用语义信息来理解语言。用于生成此类嵌入的现有方法如LASER或m~USE依赖并行数据，将句子从一种语言直接映射到另一种语言，鼓励句子嵌入之间的一致性。尽管这些现有的多语言嵌入方法可在多种语言中有良好的整体性能，但与专用双语模型相比，它们在高资源语言上通常表现不佳。此外，由于有限的模型容量、低资源语言的训练数据质量通常较差，可能难以扩展多语言模型以

关注公众号

标签：谷歌

提示：支持键盘“← →”键翻页

上一篇 KDD 2020大奖出炉！清华大学唐杰斩获时间检验应用科学奖，汤继良获新星奖

下一篇游戏、金融、电子业务喜忧参半索尼未来靠什么？

赞

你的鼓励是对作者的最大支持

相关阅读

AI 预测蝴蝶效应？谷歌最新天气预报模型 SEEDS 登 Science 子刊2024-05-01 14:47:15
微软内部邮件泄密：为追赶谷歌 AI，巨额投资 OpenAI2024-05-01 22:49:59
谷歌 Pixel 8a 手机有望可选 128/256GB 存储空间版本，售 499 美元起2024-04-30 20:29:09
利用山寨谷歌 Chrome 浏览器传播，安全公司披露安卓平台勒索木马 Brokewell2024-04-30 19:08:01
谷歌 Pixel 8a 手机可选 128/256GB 存储空间版本，售 499 美元起2024-04-30 20:29:09
谷歌证实正进行内部裁员，影响 Python / Flutter / Dart 等团队 50 余名员工2024-04-30 21:42:19
推三阻四，谷歌第三方Cookie全面淘汰计划年内无望，对国内数字营销行业有何影响？2024-04-28 20:48:36
消息称谷歌 Python 基础团队全数被裁2024-04-28 18:54:10
谷歌要求法院驳回美国司法部指控其垄断广告技术的诉讼2024-04-28 07:48:36
跻身第四大，谷歌母公司 Alphabet 站稳加入“2 万亿美元俱乐部”2024-04-28 11:14:03

热门排行榜

1日1周1月

免费发布分类信息

最新图片