在印度这个「语言难关」最前线,亚马逊的语音助手遇到了哪些困难?

摘要

Alexa 想要进入印度市场,却遭遇了前所未有的「语言障碍」。不过亚马逊已经找到了解决的办法,还打算把她变得更加人性化。

编者注:最近,亚马逊语音助手 Alexa 进入了印度市场,但和很多公司一样,它遇到了前所未有的挑战——印度国内语言和宗教环境复杂,给语音类产品的落地增加了困难。最近,外媒 Factor Daily 发布了一篇讲述亚马逊 Alexa 攻克印度市场的文章,极客公园特别进行了编译分享给各位读者。

原文发表在 Factor Daily , 原标题为《The backstory of Alexa’s Indian makeover: desi, agnostic, politically independent and… work in progress》,作者 Sunny Sen。

她很智能,说话流利,可以帮你预订出租车,查找烹饪食谱,还能播放你最爱听的音乐。她最喜欢薄荷巧克力味的冰淇淋,会着迷于男演员 Shah Rukh Khan,也喜欢 Emily Stone 和 Rachel Weisz 这些女演员。她还是一位典型的印度女士,或许能回答你所有的问题。那么她究竟是谁呢?  

她叫 Alexa,一款智能语音助手,出生在美国的亚马逊家族,但却操着一口带着印度口音的英语。因为受过专业的训练,所以上面这些对她而言小菜一碟。印度是她第四个进入的国家,这展现了亚马逊的雄心——让 Alexa 出现在每个角落,将她装进你的手机,你的车,你的家里,甚至包括酒店和办公室。早期在美国、英国和德国,Alexa 都取得过不小的成功。世界各地有几十家公司把 Alexa 添加到他们的产品当中。在 CES 展会上,福特、大众和奥迪也展示了将 Alexa 嵌入仪表板的汽车。 

亚马逊 Echo Plus 和 Echo Dot

一般情况下,当连接到互联网时 Alexa 可以回答语音提问。但在印度 Alexa 将面临一次前所未有的考验。莱迪思电子信息技术有限公司总经理 Mohan Ram 曾感慨道:语音助手在使用一种或者两种语言的国家表现不错,但印度的情况真的很不一样。

Ram 自 2001 年以来一直从事于语音识别技术领域。2001 年他告诉投资者公司将在五年内解决卡纳塔克邦的语言和方言问题。但与这个难题争斗了17 年后,Ram 却无奈地表示只能解决问题的 80%,因为印度每隔 100 公里就有语言变化,方言每 30 公里就不一样。不过他认为人工智能,机器学习和深度学习将能帮助解决问题。如今的亚马逊就是在运用新技术帮助 Alexa 对抗印度语言种类繁多这一「老大难」的问题。 

直面「语言障碍」难关

将 Alexa 推向印度市场的一年多以前,亚马逊就已经开始培训 Alexa,以迎合当地的需求。驻外经理 Puneesh Kumar 称「Alexa 需要了解当地的口语词汇及其背景。与其他单一语言国家不同的是,在印度我们将更多地让 Alexa 学习带有专有名词的词语——可能是人名,地名,宝莱坞唱片名或者电影名字。」Kumar 自 2010 年 5 月以来便一直在亚马逊工作,曾在亚马逊中国担任高级项目经理,负责市场开发。在出任了两年半时间的亚马逊全球销售计划的总经理之后,他开始负责 Alexa 开拓印度市场的工作。

 亚马逊 Alexa 驻外经理 Puneesh Kumar

对于如何应对语言障碍这一难关,Kumar 曾说:「我们必须打破常规,Alexa 不能只懂得英语。我们需要训练 Alexa ,让她了解泰米尔语,印地语,泰卢固语,旁遮普语,和马拉雅拉姆语等。」语言问题对印度来说是独一无二的,因为它的行政邦就存在很多种方言。例如,位于卡纳塔克邦和马哈拉施特拉邦边界的贝尔高姆市,人们使用的语言糅合了康卡尼语,马拉地语和卡纳达语。距离贝尔高姆 386 公里, 卡纳塔克邦的城市乌都皮也存在这样的情况,人们会使用图鲁语,马拉雅拉姆语和卡纳达语三种语言。 

硅谷研究公司 Constellation Research 的首席分析师兼董事长 Ray Wang 表示:「印度人口众多,所以按邦解决问题更具实际意义。虽然Alexa在学习能力上仍然落后于谷歌,但她能够迅速赶上。」亚马逊结合云计算和人工智能两项开创性技术创造出Alexa,她通过语音交互,可以在机器学习的框架下不断地得到改进,变得越来越出色。 

Alexa 基于自然语言理解,可以理解句子和语境,并将其从文本转换为语音。这需要她区分好语境,比如在美国和英国,当人们说到「Marks」这个词时,他们谈论的是「痕迹」,但在印度,这通常是指「成绩和分数」。通过机器学习,Alexa 知道了印度是以 lakhs(十万)和 crores (千万) 为单位计数,而不是以 millions(百万)和 billions(十亿)为单位。除此之外,她掌握了 UP(北方邦),MP(中央邦)和 CM(首席部长)这类缩写词汇,也学习了印地语,如 haldi,jeera 和 dhania 等常见的单词。 

专为印度量身打造  

目前 Echo 设备的客户体验仍在改进当中,如获取新闻和天气信息,语音控制智能家居产品等等。如果在 FactorDaily 班加罗尔办事处向Echo 提问「谁是 Anand Murali」,或许它会给出一个错误的回答。而理想情况下,Echo 理应识别出 Anand ,并在搜索结果的顶部显示他的 LinkedIn 个人资料。 

实际体验中, Shonali Muthalaly 认为 Alexa 还不完美,「Alexa 仍在搞清楚印度,因此当我让她推荐餐馆,预测路况和规划路线时,她的回答往往一团糟」。Kumar 对此回应:随着越来越多的人用上 Echo 设备,更多的话语将被用于数据分析, Alexa 也能学习到更多,情况会慢慢好转的。 

Kumar 坦白培训 Alexa 并不容易。亚马逊以一套有限的词语开始训练她,词大约有一万个,这些词被称为训练数据。此外, Alexa 还要通过测试数据的训练,而这个数据的量是无限的。识别语音过程中,Alexa 将模式,声音,词汇和语境结合起来分析用户说话的内容。如果有一处与信息库内容不匹配,Alexa 会对此进行跟踪,同时形成一个关于不匹配信息的数据集,交由机器学习处理。


在 Kumar 看来, Alexa 的「杀手锏」在于无论用户怎么表达语音指令,她都能真正理解用户的意图。例如,用户想要播放歌曲,他可以说「播放 XX 电影的歌曲」,或者「播放 XX 作词者的歌曲」,甚至不说出「播放」这个词,只说「为我唱歌,帮我缓和下心情」。而为了更好地达到这个效果,Kumar 表示他们正在尝试增强语言的相关性。如果用户在获取结果后的几秒钟内说「不」或重新输入语音命令,机器学习算法也能明白 Alexa 没有做到用户所期待的。 

亚马逊使用了机器学习和人工干预两种方法训练 Alexa,尤其是针对同一个词有多个发音的情况。为使 Alexa 更准确地区分它们,亚马逊专门请了非常熟悉这些词汇的人进行监督,以确保她发音准确。当然不可能每个单词都这么做,所以训练系统会提取前 20 或 30 个单词用于训练。 

此外,Kumar 表示虽然亚马逊希望 Alexa 能够理解不同的文化,口音和对着麦克风说话时人的思维方式,但它的声音并不会从南到北发生变化。所有 Alexa 说出的词语都用纯正的印度语录制。由于不可能录入每一个单词,亚马逊选择了一组单词作为基本词汇,并将它与机器学习,语音和词典结合起来。另外,为了让 Alexa 熟悉各种口音和语言,亚马逊也让不同语言使用者入录声音。在机器学习的帮助下, Alexa 在印度的声音得到了统一,Kumar 将之视为 Alexa 的专属「人格」。 

来自「星际迷航」的灵感  

亚马逊的 Alexa 语音服务和技能负责人 Steve Rabuchin 此前告诉《连线》,Alexa 的产生其实受到了「星际迷航」中出现的电脑的启发——用户可以通过简单的语音命令来控制周围的一切。 

在全面进入印度市场之前,Alexa 就拥有了 10800 种技能,而当初在美国推出时她只有 13 种技能。技能是基于语音的应用程序,它允许用户使用语音命令来操作应用程序。Kumar 认为无论男女老少都能轻松学会使用这些技能。亚马逊已经与印度的开发商展开了合作,将流行的应用程序整合到语音助手当中。目前支持的应用如下:

  • 旅行类:Ola,Goibibo,ixigo 和 Jet Airways;
  • 饮食类:Faasos、Zomato、Freshmenu、Sanjeev Kapoor 和 Tarla Dalal;
  • 音乐类:Saavn 和 Bollywood Hungama;
  • 运动类:ESPNCricinfo;
  • 新闻和教育类:Times of India,NDTV、ABP Live、AajTak 和 Byju's;
  • 智能家居类:Syska 和 Silvan;
  • 家政服务类:UrbanClap 和 Housejoy 。

 

「亚马逊非常具有侵略性,我们希望他们能够在很短的时间内生产几百万台设备。」ixigo 的首席执行官兼联合创始人 Aloke Bajpai 认为 Alexa 是一个很好的发行平台。但他没有将 ixigo 限制在 Alexa 平台上,而是尝试建立自己的语音助手 Tara。在 Bajpai 看来, Alexa 作用有限,它需要变得更加积极,比如节假日临近的时候主动为用户提供一些建议。但他认可谷歌和亚马逊两大公司把业务重心放在语音助手后给自己带来的影响,「语音合成技术已经得到了改善,在此基础上,我们也在使用他们的 API」。  

除了让 Alexa 疯狂学习的同时,亚马逊也在塑造她的「人格」。Kumar 在一封电子邮件中提到:「我们将为她设计个性和个人偏好而使她更加人性化。最终,她在宗教上将是不可知论的,在政治上独立,同时成为科学与技术,创新和进步的拥趸。」 

对于 Alexa 是否充当着男女朋友或者忠诚伴侣角色的说法, Kumar 这样回应:「我们希望的是 Alexa 能够成长为专业的语音服务平台,可以在任何情况下与人交谈,并且真正地懂用户的心。比如,当有人说『我现在压力很大』时,她会关心地询问『要不要来一些放松的纯音乐呢?』。」 当然,在 FactorDaily 愉快工作的我们并不需要 Alexa 提供轻音乐减压。 

头图来源:Factor Daily

图片来源:Factor Daily


打开极客公园App阅读更多内容

最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。