讯飞翻译机2.0:让世界“聊得来”

时间:2022-04-19 09:52:15 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
讯飞翻译机2.0:让世界“聊得来”

作者:暂无

来源:《上海信息化》 2018年第10



文/李倩 张沛

不用辛苦“啃”书,也不用花钱报补习班,只需一个小小的讯飞翻译机2.0,就能“掌握”30多种语言,让我们与世界各国的朋友进行无障碍交流。

“你好,鲍里索夫总理。”李克强总理对着一只小小的翻译机说罢,这句话立刻被翻译成保加利亚语,传递给身旁的保加利亚总理鲍里索夫。20187月,李克强总理出席在保加利亚举行的中国中东欧国家地方合作成果展,鲍里索夫对这只小小的翻译机很感兴趣,李克强总理随后自己付钱购买赠予保加利亚总理。鲍里索夫接过翻译机愉快地说了一句保加利亚语,翻译机随即翻译成中文:“谢谢你,中国总理!”

这台让李克强总理现场体验并自掏腰包、买来赠予鲍里索夫的小小翻译机,正是来自科大讯飞股份有限公司(以下简称“科大讯飞”)的讯飞翻译机2.0

科大讯飞成立于1999年,在语音合成、语音识别、口语评测、语言翻译、声纹识别、人脸识别、自然语言处理等智能语音与人工智能核心技术上处于国际先进水平。

科大讯飞是目前我国唯一以语音技术为产业化方向的“国家863计划成果产业化基

地”“国家规划布局内重点软件企业”以及“国家高技术产业化示范工程”,并被原信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。

科大讯飞入选首批国家新一代人工智能开放创新平台,明确依托公司建设智能语音国家新一代人工智能开放创新平台。随后,“国家智能语音高新技术产业化基地”“语音及语言信息处理国家工程实验室”也先后落户科大讯飞。

20184月,讯飞翻译机2.0正式发布,这是科大讯飞继推出具备离线翻译功能的“晓译”翻译机之后,推出的新一代人工智能翻译产品,采用神经网络机器翻译、语音识别、语音合成、图像识别、离线翻译以及四麦克风阵列等多项全球领先的人工智能技术。

讯飞翻译机2.0支持中文与英、日、韩、法、西、德、俄、泰、意、葡、荷兰、阿拉伯等全球33种语言即时互译,中文与英、日、韩、俄语言的离线翻译,粤语、四川话、东北话、河南话的识别和英语翻译,还支持拍照翻译等功能。

20172018年,讯飞翻译机连续两次亮相全国两会。20184月,讯飞翻译机20成为博鳌亚洲论坛官方唯一指定翻译机。

机器翻译技术的前世今生

机器翻译是一套系统工程,不仅仅是翻译本身,而是涉及分词处理、语言规整、命名实体识别、核心翻译模型、稀疏词处理、复杂句式处理等多项技术的综合。

随着基于深度学习的人工智能技术的发展,机器翻译水平近些年取得大幅提升,技术路线从之前的统计机器翻译演进到基于端到端的神经机器翻译,翻译结果更加流畅自然,部分场景已经突破了应用门槛,对不同国家和民族的人们交流起到较好的辅助作用。


机器翻译当前的难点之一是对双语训练数据量的要求,对于中文、英文、日语等语料比较丰富的语种,已经达到非常不错的效果,但对于一些双语训练数据资源有限的语种,还需要新的技术突破。

机器翻译难点之二是生僻词的翻译,由于在训练数据中出现次数较少甚至没有出现,导致翻译结果容易出错。尽管已经采用了一些方法做外部知识的集成,但语言词汇的长尾效应,会导致一些词汇翻译效果不佳。

机器翻译难点之三是复杂甸式的翻译,以中文、英文为例,语言表现力非常丰富,从句嵌套、排比等会导致翻译困难,个别情况也会影响翻译效果。

机器翻译难点之四是涉及文化背景的翻译,机器当前主要从数据中学习,更偏向字面翻译,如果翻译的甸子涉及太多的文化背景知识,那么当前机器翻译技术还不具备这个能力。

语音翻译是一套复杂的应用系统,涉及语音识别、语音合成、机器翻译技术三大人工智能核心技术。目前普遍采用的流程是:首先,语音识别把待翻译的语音识别成相应的文本;然后通过机器翻译模块,把源语言文本翻译成目标语言文本;最后,语音合成把目标语言朗读出来,即实现了单向的语音翻译。机器学习首先要定义问题,设计模型结构以及输入输出,然后基于大规模训练语料,采用反向传播算法进行模型参数的训练。

科大讯飞在201 2年开始投入机器翻译技术的前期研发。201 4年,在IWSLT(国际口语机器翻译评测比赛,International Workshop on Spoken LanguageTranslation)英汉互译任务中,科大讯飞所有指标均位列第一;在2015NIST( National Institute of Standards and Technology,美国国家标准与技术研究院)组织的openMT翻译评测中,汉英翻译人工分再次取得第一,奠定了科大讯飞在机器翻译上的佼佼者地位。

小小翻译机,背后大不同

机器翻译仅仅是文本到文本的翻译,而讯飞翻译机采用的是语音到语音的翻译技术,涉及语音识别、机器翻译、语音合成三个模块。

翻译机20虽然只有手机大小,却集合语音识别、语音合成、离线翻译等于一身,内部搭载了四麦克风高清降噪技术,在嘈杂环境中也能准确识别语音并即时翻译。

讯飞的翻译技术最早采用基于统计机器翻译的算法( Statistic Machine Translation)后来基于神经网络的方法做多系统融合,现在采用最先进的神经机器翻译,并针对当前存在的问题做了大量改进。科大讯飞以工匠精神对机器翻译的每个模块都做过精细打磨,力求呈现给大众一套完美的系统。

打造一台讯飞翻译机2.0,需要用到哪些科大讯飞的核心技术’神经网络机器翻译技术最为关键,它可以排除以往机器翻译中出现的语序不顺、语义不明等情况,对口语化的表达也能做到准确辨认。科大讯飞全球首创INMT离线翻译引擎,最早将人工神经网络用于人工智能算法翻译,可理解度高达95%

其次,还有让机器“听懂”人类语音的语音识别技术,将语音中包含的文字信息“提取”出来。该技术在souAD( Stanford Question Answering,机器阅读理解挑战赛)中,连续四次刷新最好成绩;在2016CHiME-4国际多通道语音分离和识别大赛中,获得全部三项冠军;在刚刚结束的2018 CHiME-5比赛中,科大讯飞叉包揽所有四个项目冠军,并大幅刷新各项目的最好成绩。


语音合成技术是讯飞的“绝活”。这项实现人机语音通信的关键技术,能够让智能合成发声媲美播音员。值得一提的是,该技术在Blizzard Challenge国际语音合成大赛中,目前已经获得了“十三连冠”的好成绩。

图像翻译功能运用到图像识别技术。科大讯飞拥有业界领先的OCR图像识别技术,优化对手写文字的OCR识别。存第24届国际模式识别大会( ICPR 2018)举办的MTWI( Multi-Type Web Images.多样式网络图像)图文识别挑战赛中,科大讯飞与中科大语音及语言国家工程实验( NELSLIP)联手,通过机器的识别、定位、分析,一举包揽全部三项任务的冠军。

此外,还有通过机器自动对发音进行评分、检错并给出矫正指导的语音评测技术,让机器处理、理解人类掌握的自然语言,使机器具备人类的听说读写能力的自然语言理解技术。

目前,讯飞翻译机2 0支持中英、中日、中韩、中俄等离线语音翻译。离线语音翻译整体实现框架和在线基本一致,语音首先通过本地语音识别得到源语言文本,然后通过机器翻译得到目标语言的文本,最后通过语音合成得到目标语言的声音。离线翻译最大的难点是内存、计算资源有很大限制,相比云端服务器GPU运算单元和256G的内存空间,离线翻译终端运算能力和内存空间都十分有限,因此,不得不对语音识别、机器翻译、语音合成做模型裁剪压缩,甚至将部分模块直接裁掉不用(如词性分析等)。在有限的资源下,做到核心效果损失最小。

翻译机应用与发展

讯飞翻译机解决了许多人工作生活中的沟通困难,赢得了海内外的赞誉与好评。仅翻译机2.0-项产品,就荣获2018亚洲消费电子展( CES ASIA 2018)创新产品奖、2018亚洲消费电子( CES Asia 2018)官方合作媒体中关村在线颁发的“最佳人工智能产品奖”,还荣获了CES Asia 2018官方合作媒体中关村在线颁发的“用户选择奖”。在2 018中国欧盟旅游年系列活动和中国驻欧盟使团对外开放日上,讯飞翻译机也成为焦点。同时,讯飞翻译机还获得了第20居中国国际工业博览会工业设计金奖。

科大讯飞在合作方面也频频出手。比如,携手上海外国语大学高翻学院,共建上海外国语大学一科大讯飞智能口笔译研究联合实验室;联合ITU(国际电信联盟),共同开展国际电联智能语音和人工智能技术的研究与应用;与中国外文出版发行事业局共同打造国家级的人工智能翻译平台。

“它是我们翻译战略下被精准定位的产品,是我们战略落地的一个支点。”谈及翻译机2 0,科大讯飞执行总裁胡郁这样说。在构建人类命运共同体的宏愿下,这一战略被描述为“人类语言大互通计划”。

在“一带一路”的倡议下,科大讯飞提出“人类语言大互通计划”,可谓顺应时势。目前,该计划已从倡议阶段转向研讨阶段。未来,不仅是翻译机,包括听见系统等各种语言及语音交互产品都将成为重要布局。

以“做最好的AI翻译助手”为目标,讯飞翻译机2.0将在人类与AI同行的新时代中,为各国文化的融合与交流做出贡献,让世界“聊得来”。


本文来源:https://www.wddqw.com/doc/5fb22fd95afb770bf78a6529647d27284a7337ab.html