本地 天下 发现自贡 文化 健康 教育 商圈
搜索

新型人工智能工具可翻译200种语言

2024-06-07 16:55 央视新闻

0

分享

人类有超过7000种语言,其中包括使用人数不多、相关资料稀少的“小众语言”。美国“元”公司新研发的一个人工智能模型,能翻译200种不同语言,实现了对较多“小众语言”在线翻译。

人工智能翻译目前多利用基于人工神经网络的模型翻译各种语言。这些模型通常需要大量可在线获取的训练数据。不过,有些特定语言的数据尚不能公开和低成本获取或普遍可及,这类语言又被称为“低资源语言”。

“元”公司团队新研发的一种跨语言技术,能让基于人工神经网络的翻译模型学习如何利用已有的翻译高资源语言的能力来翻译低资源语言。团队应用该技术开发了一个名为NLLB-200的在线多语言翻译工具,可容纳200种语言,其能翻译的低资源语言的数量是高资源语言数量的3倍。这一研究成果近期发表在英国《自然》杂志上。

由于研究团队在许多低资源语言上只能获取1000至2000例样本,为扩大NLLB-200的训练数据量,他们利用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘这些语言与英语的双语文本数据,帮助提升模型的翻译质量。

研究者称,该翻译工具可帮助低资源语言使用者使用互联网等技术,且这一模型还可用于教育,帮助这类人群获取更多图书和论文资料。不过研究者也表示,这一工具的误译情况仍有可能出现。

编辑:金艳

责任编辑:冉华阳

相关新闻

Copyright © 2006-2024 WWW.ZGM.CN 自贡网 All Rights Reserved. 自贡日报社 主办

地址:四川省自贡市汇川路1240号自贡报业大楼 电话:0813-8220769 8220773 邮箱:webmaster@zgm.cn

互联网新闻信息服务许可证编号:51120190016 蜀ICP备11013724号 川公网安备51030002000105号

信息网络传播视听节目许可证编号:1-23-3-2-0008

涉本网站网络内容从业人员违法违规行为举报电话:0813-8220769 网络内容从业人员违法违规行为举报

涉未成年人投诉举报电话:0813-8220770 电子邮箱:wcn@zgm.cn | 涉互联网算法推荐专项举报渠道

中国互联网举报中心举报电话: 12377 | 涉本网站违法和不良信息举报电话:0813-8220770 | 涉企举报专区

食品安全投诉举报电话:0813-2988060 电子邮箱:zgsscjgjyjk@163.com