Facebook开源新AI语言模型,“可对100种语言实现一对一翻译”
根据《siliconangle》消息:Facebook表示其利用AI技术在不依赖英语数据的情况下翻译任意两种语言的尝试,已经取得了实质性进展。Facebook正在开源一种名为M2M-100的新AI语言模型,该模型可以在100种语言中的任何一对之间进行翻译。据称,以前的多语言模型严重依赖英语作为中介,例如,中文译成法文的步骤通常是从中文译成英文,然后再从英文译成法文。在大多数情况下,这种模型都可以很
原创
2020-10-21 13:08:12
来源:钉科技  

根据《siliconangle》消息:Facebook表示其利用AI技术在不依赖英语数据的情况下翻译任意两种语言的尝试,已经取得了实质性进展。Facebook正在开源一种名为M2M-100的新AI语言模型,该模型可以在100种语言中的任何一对之间进行翻译。

【201020】Facebook开源新AI语言模型,可对100中语言实现一对一翻译168_副本.png

据称,以前的多语言模型严重依赖英语作为中介,例如,中文译成法文的步骤通常是从中文译成英文,然后再从英文译成法文。在大多数情况下,这种模型都可以很好地工作,但是在涉及更复杂的句子和短语时通常不准确。

Facebook表示,M2M-100可以直接从中文翻译成法语,或者在100多种语言对之间进行翻译,从而更好地保留含义,而无需使用英语作为中介。

在这么多不同的语言对之间进行翻译不是一件容易的事,因为模型需要访问海量的高质量训练数据。Facebook人工智能研究员Angela Fan在一篇博客文章中解释了她和她的团队如何着手创建一个庞大的“多对多”数据集,其中包含100多种不同语言的超过75亿个句子。

这些数据根据诸如语言分类、地理和文化相似性等参数分为14种不同的语言组。然后,在每个语言组中,Facebook为每个语言标识一到三种“过渡语言”,作为将其翻译成不同语言的基础。

M2M-100模型比Facebook当前使用的以英语为中心的多语言模型准确度更高。该公司声称,M2M -100在评估机器翻译的BLEU度量标准上比之前模型高出“10分”。

Facebook最终希望用M2M-100替换之前的翻译模型,以提高其翻译质量。(钉科技根据《siliconangle》消息编译)

最新文章
1
2025华蒜品牌收入降39%、ODM和欧美业务亮黄灯,奥克斯亟待破局
2
退出还是转手?三星显示器去留悬念背后,是家电业务走向
3
做人形机器人,不是拼人头:马斯克与王兴兴正在改写规则
4
十大面板厂2025财报:四家增长、三家扭亏,一液晶大厂利润降97%
5
从“被动操作”到“主动服务”,国补下的家电行业智能化提速
6
从流量到Token:运营商能否打破“管道化”宿命?
7
2月全球液晶面板市场出货同比下降11.2%,涨价幅度小
8
从“被动操作”到“主动服务”,国补下的家电行业智能化提速
9
京东方回购、TCL重组,显示面板行业将走向何方?
10
安卓终端涨价潮来袭 老品新品手机平板均受波及
11
机圈专业V单来了!vivo X300 Ultra正式开售:6999元起
12
阿里云位居中国金融智能体市场第一 32.4%市场份额断层领先
13
TCL领跑酒店电视市场,行业“老大”重塑智慧客房数智化体验
14
从易点天下与亚马逊云科技的深度协同,看出海营销的AI解法
15
BOE(京东方)2025年营收重回2000亿级 持续分红回购加大股东回报
16
华帝用三大“品牌特质”,拿下了“用户心智”
17
快手商家38上新季生意爆发,多维拆解增长解法
18
你的青春又有歌了!周杰伦《太阳之子》上线,多重限定玩法快手同步开启
19
快手千人共跳五禽戏,为南宁三月三注入非遗力量
20
透视美的海尔TCL海信创维2025财报,穿越波动周期靠这三点
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512