探访:微软是怎么做机器翻译这件事的?

摘要

很快,两个语言不通的人之间就能相互打电话了。

必须承认,虽然之前参加了许多次的产品/技术介绍活动,也看了不知多少次的 Demo 演示,但微软翻译(Microsoft Translator)在上周给出的演示效果还是让我吃了一惊:同声传译们要小心了,微软的这个新功能真的可以威胁到你们了。

事情是这样的:

瑞典有一个移动运营商,它应用微软的语音翻译的 API 集成到他们后台的通信网络系统。于是乎,除了对方本人的说话声音之外,两个说着不同语言的人可以在打电话的时候直接听到手机里传过来的翻译的声音。由于这个功能是集成在通讯系统里面的,所以用户直接就可以获得这个功能,不需要下载 App。

在当天的演示中,微软的两位同事分别操着英语和法语互相打了半天电话,两人通过手机里传过来的翻译声音,基本理解了对方的意思。

如果说自动驾驶汽车让司机们感到了生存的危机,那微软的这个演示恐怕会让很多翻译和同声传译们心头一凉:机器的触手已经伸到我们身边了。

捕获微软翻译3.PNG

                                    (微软翻译在内部的应用范围)

重视企业级用户

谈到机器翻译这个领域,大家的脑海中可能会浮现出微软、Google、百度等大公司的身影。其实在过去的很多年中,人类一直在探索这样的技术。在过去五年左右,这个技术取得了重大突破,到今天虽然还不够完美,但是已经能够应用到真实的场景中了。

相比其他公司,微软在机器翻译领域最大的特点就是把重点更多地放在了 B 端企业级用户上,这点也秉承了微软整体的产品策略。毕竟,自从纳德拉上任之后,他提出的「移动为先云为先」的策略也决定了微软必须将重点放在 B 端用户这一边。

Microsoft Translator 是基于云计算开放的 API 技术,从 2008 年开始,这项技术首先被用在微软自己的产品里面,包括 Office 和必应等。到 2011 年,微软开放了 API,让第三方用户也能够接入使用这个技术,达到和微软产品一样的翻译结果。目前,Microsoft Translator 已经服务于全球上千家企业客户,包括亚马逊、eBay、Twitter、惠普、戴尔等。

捕获微软翻译.PNG

目前他们的 API 包括两个,一个是文本翻译,一个是语音翻译。现在微软开放的主要是文本翻译,那数千家客户使用的也大都是这个部分,而语音翻译由于技术才完善不久,其 API 于今年 3 月才刚刚开放。

在谈及自己在企业级用户方面的优势时,微软研究院 Microsoft Translator 产品战略总监 Olivier Fontana 提到了三点:第一,重视企业级用户,为他们提供了很可靠的解决方案;第二,产品可定制,能根据不同的行业定制不同的语料库;第三,扩展性好,比如他们最近增加了 Microsoft Edge 浏览器的翻译拓展功能,如果用户安装了 Windows 10 的周年更新版本,那他就能使用这个浏览器翻译功能了。

语音翻译是新的发展方向

现在,我们来着重谈谈微软目前重点发展的方向:语音翻译

事实上,对于我们一般用户来说,我们目前大量使用的还是文字翻译。不管你是文字输入还是拍照,你所进行的基本都是文字之间的互通。但事实上,语言总是要靠声音「说出来」的,我们最终还是要回归语音交互的道路。

                     (2012 年微软语音机器翻译实时演示的场景,很有说服力)

按照我们一般的理解,语音翻译的大概流程就是「听到声音-变成文字-翻译-从文字再变回声音。但根据微软的测试,这样的方式其实效果并不好。

微软的做法是这样的:自动语音识别(ASR)-TrueText(智能文本校正)-自动文本翻译-文本到语音转换(TTS)。其中最关键、也是让语音翻译这个过程脱胎换骨的环节有两个,第一个就是 TrueText,另外一个则是大量基于口语的语料库。

捕获微软翻译1.PNG

TrueText 的作用很简单,就是把不是特别规范的口语进行调整,变成更容易理解和翻译的文本,比如「啊」、「嗯」、「这个」、「那个」之类的。此外,微软还建立了大量口语化的语料库充实到文本翻译中,根据他们自己的说法,微软是目前唯一一家添加了语音数据库的公司,这种口语化的翻译模式让语音翻译听起来更加自然。

目前 Microsoft Translator 支持对包括中文普通话在内的 8 种语言的实时语音翻译(英语、法语、中文、德语、意大利语、西班牙语、阿拉伯语、葡萄牙语)。在 Skype Translator 以及 Windows、iOS 或者 Android 版的 Microsoft Translator 应用中,你都可以体验到这项私人实时口译服务。

用多种途径帮 C 端用户解决难题

当然,对于我们一般的 C 端用户,微软也不是没有解决方案,他们推出的 Microsoft Translator 移动端 App 就是一个很不错的应用。这款应用不仅适用于 Windows 设备,同时还支持使用 iOS、Android 平台的设备,甚至包括 Apple Watch 和 Android Wear 智能手表。

打开这款应用,你能直接看到四大功能:语音翻译、文字翻译、两人对话翻译以及拍照翻译。基本上不管你的需求是什么,它都能提供一个基本的服务。此外,在文字翻译和拍照翻译的场景下还可以下载离线的语言包,在外就不用漫游使用数据了,离线就可以翻译。

捕获微软翻译2.PNG

同时,我们普通用户更加熟悉的微信中也少不了 Microsoft Translator 的身影。据了解,除了中英文之间的翻译是微软翻译和有道翻译各占一定的比例之外,微信中其他语言的翻译,如法语、日语或阿拉伯语等均是微软提供的服务。

此外,在中国越来越流行的「海淘」则是 Microsoft Translator 的另一个用武之地。基于 Microsoft Translator 技术的必应翻译提供了在线文本翻译和网站翻译功能,只需输入你的海淘网址,就能实现整个网页的机器翻译,并且同样支持 50 多种语言,让你的海外购物无障碍。Windows 10 用户通过添加 Edge 浏览器的 Translator 扩展插件,即可一键翻译整个网页或者文本。

结语

应该说,由于翻译这个领域需要大量的数据积累,所以它还是一个大公司的竞赛场。微软当然是其中很有竞争力的一员,他们在企业级用户方面有自己的优势,同时也在通过开放 API 的措施吸引着更多的开发者加入他们的队伍中。

虽然对于翻译和同声传译们来说,机器翻译的进步可能不是一个好消息。但对于更多的普通人来说,也许在未来的某一天,我们真正可以做到不会一句外语就能行遍天下。

最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。