中商官网 招商通 数据库

一文看懂我国机器翻译发展情况及BAT、科大讯飞等企业格局分析

观产业

中商产业研究院2018-08-07

中商情报网讯:随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。机器翻译,又称为自动翻译,是利用计算机将一种自然语言转换为另一种自然语言的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。机器翻译相较于人工翻译具有三个明显的优势:成本低、易把控以及翻译速度快。

机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机计算能力的提升和多语言信息的爆发式增长,机器翻译技术逐渐走出象牙塔,开始为普通用户提供实时便捷的翻译服务。

机器翻译的发展历程

资料来源:中商产业研究院整理

机器翻译的应用

在具体应用上一般分为三种,分别是:词典翻译软件、计算机辅助翻译软件和机器翻译软件。

第一种是最基本的网络查词翻译,查询对象一般为单个的字词、简单的词组或者是固定结构。

第二种为计算机辅助翻译,其原理为利用计算机的记忆功能将译者之前翻译的资料进行整理,以便为之后出现的类似翻译提供便利条件。CAT软件产业已经比较成熟,例如GoogleTranslatorTolkit、MicrosoftLocStudio等,Trados占有国际计算机辅助翻译软件产业绝大多数的市场份额,微软、西门子等国际大公司都是它的用户。

第三种是机器翻译软件,即MT。其原理为应用计算机按照一定规则把一种自然语言转换为另一种目标自然语言。此过程一般指自然语言之间句子和段落等的翻译,大部分见诸于世的翻译软件,如谷歌翻译、金山词霸和有道翻译等均属于机器翻译软件。

机器翻译的企业格局

近年来随着人工智能的发展,机器翻译技术也越发成熟。各大BAT等公司相继推出自己的翻译系统,以及一些新兴的高新技术企业共同构成了我国机器翻译的竞争格局,下面一起来了解一下我国机器翻译企业的基本情况吧!

1.百度

2010年初,百度组建了机器翻译核心研发团队。2011年6月30日,百度机器翻译服务正式上线,目前支持28种语言的互译。百度翻译在海量翻译知识获取、翻译模型、多语种翻译技术等方面取得重大突破,实时准确地响应互联网海量、复杂的翻译请求。百度翻译所研发的深度学习与多种主流翻译模型相融合的在线翻译系统以及基于“枢轴语言”等技术,处于业内领先水平,在国际上获得了广泛认可,使我国掌握了互联网机器翻译的核心技术。此外,百度翻译还开放了API接口,目前已有超过2万个第三方应用接入。华为、OPPO、中兴、三星等手机厂商,金山词霸、灵格斯词霸、敦煌网等众多产品均接入了百度翻译API。

资料来源:官网

在2013年,百度就布局神经网络翻译,算力、算法、模型等方面展开研究,突破了神经网络翻译的核心技术瓶颈。

2015年,百度发布了世界上首个神经网络赋能的机器翻译服务,并在同年实现基于神经网络的离线翻译,带领机器翻译进入新的历史阶段。

2017年底,百度翻译被MITTechReview评选为2018年世界十大突破技术,被列为即时语音翻译领域关键玩家,是当年度唯一入选的中国公司。

百度翻译的技术优势:

第一,创新性地提出了将深度学习模型和多种主流翻译模型相融合,包括传统的基于规则、基于实例、基于统计等翻译策略,做到发挥多种方法各自优势,从而从整体上提升翻译效果。据公开资料显示,百度翻译是国际上第一个基于深度学习模型的大规模线上机器翻译系统。

第二,通过将句法分析技术融入翻译系统,利用句法特征有效的解决了翻译过程中的句子长距离调序问题。

第三,系统提出了基于“枢轴语言(pivotlanguage)”的机器翻译模型,攻克了机器翻译中小语种覆盖和语言快速迁移的难题。

第四,将百度最先进的搜索技术与翻译技术相结合,基于网页检索、网站权威性计算、大数据挖掘、新词侦测等技术,从海量的互联网网页中获取高质量翻译知识。

2.阿里巴巴

阿里机器翻译是基于阿里巴巴海量电商数据并结合机器学习、自然语言处理技术,实现多语言语种识别与自动翻译功能,为跨境电商信息本地化与跨语言沟通上提供精准、快捷、可靠的在线翻译服务,其宗旨是“让商业没有语言障碍”。

阿里巴巴2015年收购了国内最大的众包翻译平台——365翻译,开始涉入机器翻译领域。

2016年10月起正式开始自主研发NMT模型,2016年11月首次将NMT系统的输出结果应用在中英消息通讯场景下的外部测评中,并取得了不错的成绩。

2017年初阿里正式上线了自主开发的神经网络翻译系统,为阿里经济体复杂多样的国际化需求提供可靠的技术支撑。

2017年7月12日,阿里巴巴披露的一份技术资料中显示,阿里翻译团队通过使用阿里云机器学习平台PAI实现了模型训练效率5倍的飞跃,并已应用在英俄电商翻译质量优化项目中。在阿里巴巴内部,阿里翻译负责为1688国际站、全球速卖通等提供多语言服务,中国卖家填写的一些中文信息会被机器自动翻译成多国语言。该团队同时还为钉钉、东南亚电商Lazada等提供服务。

3.腾讯

机器翻译(TencentMachineTranslation)是腾讯公司研发的人工智能机器翻译产品,基于自研的神经网络翻译引擎,能够从海量语料库中自主学习,在翻译的全过程中整体建模,从而达到翻译结果的高准确率与流畅度。

2016年初,腾讯开始研发AI翻译产品,并正式推出机器人翻译一一翻译君。腾讯机器翻译目前支持中英日韩法德意土等15种语言,83种语言对的翻译能力,其中中英互译引擎已经在新闻、教育和部分科技领域达到业界领先水平。

2017年宣布翻译君上线“同声传译”新功能,用户边说边翻的需求得到满足,语音识别+NMT等技术的应用保证了边说边翻的速度与精准性。腾讯机器翻译基于腾讯领先的底层算法、丰富的中文知识图谱和先进的NLP引擎能力,结合了神经网络机器翻译和统计机器翻译的优点,对源语言文本进行深入理解,使翻译效果更为准确,同时支持语音翻译、图片翻译、语种识别等多种场景,大大减轻传统文本翻译的读写成本。

资料来源:官网

4.科大讯飞

科大讯飞成立之时就开始在语言和翻译领域布局项目。基于NMT翻译框架,讯飞翻译服务采用了国际上领先的翻译技术,通过整合注意力网络机制和循环神经网络,完美模拟人脑翻译的机制,生成流畅的译文,支持中英、中日、中韩等多种语言互译。基于深度神经网络算法上的创新和突破,科大讯飞在2014年国际口语翻译大赛IWSLT上获得中英和英中两个翻译方向的全球第一名。在2015年又在由美国国家标准技术研究院组织的机器翻译大赛中取得全球第一的成绩。2017年科大讯飞还推出了多款硬件翻译产品,其中晓译翻译机1.0plus将世界上最先进的神经网络翻译系统,从在线系统优化成一个离线系统。它可以在没有网络的情况下提供基本翻译功能。

资料来源:官网

5.网易

10年前,网易有道翻译产品上线,接替了传统电子翻译机“文曲星”的班,是国内最早涉足翻译领域的互联网公司。

网易2011年创立网易感知与智能中心,拥有自建分布式深度学习平台,其自主研发的图像处理、语音识别、智能问答等AI技术,已经在有道翻译中得到了应用和推广。

网易有道开始关注神经网络翻译技术,是2014年。这个举动源自行业中一项节点性事件——在国际赛事ACLWMT2014中,神经网络翻译技术的准确率首次超过传统的统计机器翻译技术,这意味着神经网络翻译初步具备了商业化的可能性。

2017年5月网易有道在GMIC未来创新峰会上公布:由网易公司自主研发的神经网络翻译技术正式上线。此次在有道上线的YNMT技术,由网易有道与网易杭州研究院历时两年合力研发,让以中文为中心的、根据中文用户使用习惯定制的神经翻译系统服务于6亿有道用户,服务于有道词典、有道翻译官、有道翻译网页版、有道e读等产品。

更多资料请参考中商产业研究院发布的《2018-2023年中国AI机器翻译行业市场前景研究报告》。


分享
本文

中商·服务

相关信息