Facebook开源新AI语言模型,“可对100种语言实现一对一翻译”
根据《siliconangle》消息:Facebook表示其利用AI技术在不依赖英语数据的情况下翻译任意两种语言的尝试,已经取得了实质性进展。Facebook正在开源一种名为M2M-100的新AI语言模型,该模型可以在100种语言中的任何一对之间进行翻译。据称,以前的多语言模型严重依赖英语作为中介,例如,中文译成法文的步骤通常是从中文译成英文,然后再从英文译成法文。在大多数情况下,这种模型都可以很
原创
2020-10-21 13:08:12
来源:钉科技  

根据《siliconangle》消息:Facebook表示其利用AI技术在不依赖英语数据的情况下翻译任意两种语言的尝试,已经取得了实质性进展。Facebook正在开源一种名为M2M-100的新AI语言模型,该模型可以在100种语言中的任何一对之间进行翻译。

【201020】Facebook开源新AI语言模型,可对100中语言实现一对一翻译168_副本.png

据称,以前的多语言模型严重依赖英语作为中介,例如,中文译成法文的步骤通常是从中文译成英文,然后再从英文译成法文。在大多数情况下,这种模型都可以很好地工作,但是在涉及更复杂的句子和短语时通常不准确。

Facebook表示,M2M-100可以直接从中文翻译成法语,或者在100多种语言对之间进行翻译,从而更好地保留含义,而无需使用英语作为中介。

在这么多不同的语言对之间进行翻译不是一件容易的事,因为模型需要访问海量的高质量训练数据。Facebook人工智能研究员Angela Fan在一篇博客文章中解释了她和她的团队如何着手创建一个庞大的“多对多”数据集,其中包含100多种不同语言的超过75亿个句子。

这些数据根据诸如语言分类、地理和文化相似性等参数分为14种不同的语言组。然后,在每个语言组中,Facebook为每个语言标识一到三种“过渡语言”,作为将其翻译成不同语言的基础。

M2M-100模型比Facebook当前使用的以英语为中心的多语言模型准确度更高。该公司声称,M2M -100在评估机器翻译的BLEU度量标准上比之前模型高出“10分”。

Facebook最终希望用M2M-100替换之前的翻译模型,以提高其翻译质量。(钉科技根据《siliconangle》消息编译)

最新文章
1
奕斯伟计算 | RISC-V OLED触控产品斩获“中国芯”优秀技术创新产品奖
2
DTC2025|TCL华星印刷OLED小尺寸突破,全产业技术创新布局
3
九昆仑低碳科技:以科技构建全球碳中和新生态
4
好设计 见未来:2025家电行业“好设计”评测发布会在北京盛大启幕
5
快手电商“宝藏小城”南通站收官,高效引爆南通家纺商达粉丝与生意增量
6
一加联动快手超级新品日打爆新品营销,首销日品牌GMV超千万
7
iQOO新机首发撬动双11爆发,超级新品日首销单品GMV破1500万
8
单款羽绒服两日爆卖千万,骆驼快手双11如何将品牌力转为购买力?
9
AI+显示:一场“双向奔赴”的产业革命
10
中国电视市场10月整机出货量324万台,创今年最大跌幅
11
三星首款三折叠手机Galaxy Z TriFold配置曝光:搭载5600mAh电池,预计12月5日发布
12
AMD官方确认:Zen6 CPU性能提升70%!
13
首发新麒麟!华为Mate X7全新外观揭晓
14
OPPO Find X9 Pro卫星通信版开售:同时能装四个号!双eSIM+双SIM卡
15
酷风空调突袭千元市场,行业价格战一触即发?
16
电视行业增长逻辑迭代:从规模扩张到“技术+场景”赋能
17
双11全渠道销量销额双冠王!海信电视创新驱动再登高峰
18
TCL电视双11全周期霸榜销量第一,SQD技术站稳顶级画质地位
19
9月洗衣机内销市场需求走低 出口市场放量
20
9月空调产销双双下滑
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512