「高情商」的人工智能,小冰这件事,微软做对了吗?

摘要

微软希望通过新一代的小冰,让机器理解什么是 EQ。

8 月 22 日,微软全球执行副总裁沈向洋博士在微软小冰的发布会上说,微软现在是一个人工智能公司。

这可能是微软高管第一次在公开活动上使用这种说法吧。在联合创始人鲍尔默之后继任的萨蒂亚·纳德拉(Satya Nadella)自 2014 年上任以来,多次表示微软的核心是「移动为先,云为先」,当时的微软渐渐放弃了从诺基亚那里买来的手机业务(Windows Phone),转而专注于移动应用的开发,从近年的财报来看,微软旗下 Office 系列应用收入喜人,同时云服务 Azure 在公司的全力支持下,也成长为公司最重要的业务,甚至威胁到了亚马逊 AWS 在云计算领域的龙头地位。

那么,人工智能呢?在全世界都在谈人工智能的时候,微软还在不声不响地补着移动互联网时代欠下的帐吗?各家大公司都已纷纷将业务和研发重心转移到人工智能领域,微软真的要眼睁睁地再一次错过一个时代吗?

当然不会。纳德拉看得很清楚,云计算、边缘计算、OS、混合现实还有 AI,微软一个都没有落下。在 5 月的 Build 大会上,虽然其云计算产品 Azure 是全场毫无争议的主角,但纳德拉还是给了人工智能业务一段专场 Keynote 的时间,而这次为微软人工智能站台的,就是曾经微软亚洲研究院的院长沈向洋。

发布会.jpg

在微软亚洲研究院工作期间,沈向洋博士在计算机视觉、计算机图形、模式识别、统计学习和机器人学领域发表了 100 多篇论文,并拥有 50 多项美国专利。2014 年他被升职调任微软全球执行副总裁,并在陆奇去了百度之后,成为微软内部职位最高的华人。


人工智能三条全球产品线

在本周二的发布会上,沈向洋博士也来到现场发表演讲,他把微软小冰定位为微软人工智能三条全球产品线之一,同 infuse AI 以及 Bing&Cortana 并列。

三条产品线.jpg

可是,微软小冰不就是一个聊天机器人吗?聊天机器人那么多,小冰凭什么能成为全球最大科技公司之一的人工智能主要业务呢?

沈向洋博士对此作出了解释,他表示在微软理解的人工智能中,它的核心是两个点:IQ 和 EQ。人工智能可以很聪明,微软前不久刚刚发布了一篇报告,称他们的图片识别已经做到了 5.1% 的误差率,远高于人类,另外现在基于人工智能的语音识别和文字翻译也做得越来越好,语音识别已经有公司做出了比人识别率更高的产品,所以机器的 IQ 超越人类是必然的。

那么情感方面呢?在《人工智能》一书中,作者李开复强调了人工智能还有很多局限,其中就包括了「情感」方面的能力,而小冰正是一个专注情感的 AI 产品,或者说,专注 EQ——按沈向洋的说法,微软是想通过小冰了解如何真正地理解 EQ。

在本次发布会前,微软刚刚推出了印度尼西亚的小冰(Rinna),落地于社交巨头 LINE 的平台上。这是全球小冰版图上的第五个国家,在 2014 年首次在中国推出小冰后,微软先后在日本、美国和印度也推出了小冰,据微软所说,小冰全球产品线的执行策略是:优先选择人口数量超过 1 亿的国家,在当地建立完全本地化的团队,初始的训练数据也完全从当地取得,从而确保小冰根植于该国本土文化。

截止至目前,小冰已经成为了全球领先的对话型人工智能系统,据微软官方统计,小冰与人类之间发生的最长一次单人连续对话,不间断地进行了 29 小时 33 分钟,达到了 7151 轮。


AI 交互产品的三个阶段

微软将人工智能交互产品的演进分为三个阶段,首先是基本的人工智能交互,及拥有一种或多种的交互方式,比如文本、语音、图像等。其次,是初级的感官,即在人工智能系统中,用一种核心引擎将上述的交互统一起来,是不同感官可以混合应用,这一点小冰在 2015 年发布的第三代之后就已经能够做到了。

最后,是高级感官,也就是本次发布会第五代微软小冰的重点升级部分。高级感官是由多种初级感官有机融合之后形成的,因而交互能力更强,对综合技术储备和数据的要求也大幅度提高。例如全双工语音这一种高级感官,就需要首先同时具备文本、语音(含 SR 和 TTS)两种能力,同时要求两种能力均达到更高的质量标准。

高级感官能够大幅度地提升交互体验,更加贴近于人类的自然交互行为。例如:如果将全双工语音这种高级感官的体验比拟为打电话,则之前的智能助理语音交互体验类似于对讲机。此外,高级感官还能够大幅度拓展人工智能系统的落地场景,使小冰有能力根据自己的「意愿」与人联络,从而主动保持与人类用户之间的关联。


第五代微软小冰

当然,除了最重要的「情商」升级,第无代微软小冰还更新了许许多多的新花样,它全面进入了 IoT 领域,与小米 IoT 开放平台合作,目前已经能够通过语音控制米家平台上全部 35 中智能设备,另外小冰还拥有了自己的电台,在微信小程序里搜索小冰电台就可以听到小冰 24 小时不间断自动创作的电台节目了。小冰电台.jpg

在发布会的最后,面对现场上百位媒体记者,微软发布了小冰针对媒体的全新智媒体商业平台解决方案 3.0,它与 Bing 搜索引擎加速整合,在媒体生产力、知识图谱、智能交互和全平台互动等六个新模块为媒体提供支持。

其中,通过 Bing 搜索引擎的全球大数据能力,新的解决方案可为媒体构建出一个基于全球新闻数据源的媒体知识图谱,从而能准确挖掘全球资讯中每一篇内容背后的知识与含义,并构建出彼此的关系,从而帮助媒体更全面快速地梳理时间和内容背后的故事。而通过人工智能的介入,在读者与人工智能的自然交互中,获得更多推荐内容,有助于改变用户的阅读习惯,从被动的阅读体验逐步变为主动的交互信息交换。


微软真的做对了

对很多人来说,微软小冰是一个不痛不痒的人工智能产品,她不像无人驾驶那样酷炫,亦不像 AlphaGo 那样惊世骇俗,从 2014 年诞生起,微信和 QQ 的许多用户多少都有接触过她,但大多说都是无聊时聊两句就作罢了,很少有人会把小冰当做电影《Her》里那个 AI 女友一样对待,当然,小冰也没有那么高的智能程度。

而当人们接触到这样一款触手可及的人工智能产品时,他们的期望值其实是很高的,正如微软小冰之父李笛在接受极客公园的采访时所说的,「对于人工智能,我们被行业的浮躁和科幻电影无限拉高的期待,这种期待已隐隐成为阻碍这一行业脚踏实地发展的高墙。」

当微软宣布小冰已经是其人工智能的三条最主要的产品线之一时,许多人是无法理解的:那就是个聊天机器人啊,最多送她一个「最佳聊天机器人」的称号,并没有什么太特别的东西吧?

所以,为什么作为世界上最大、科研能力最强的科技公司之一,微软会将这样一个「聊天机器人」作为自己的看家产品之一呢?

对微软来说,绑定在 Windows 10 上的 Cortana 可能是它最主要的人工智能交互产品,但小娜时偏理性的,小冰则不同,如上所述,小冰是偏向情感计算的,沈向洋在演讲中也提到,其实像小娜一样,各家在做的人工智能交互系统都是偏向解决 IQ 问题的,但真正让人感到智能的交互,应该是有情感的。

所以作为一个「聊天机器人」,小冰更有机会让用户感受到「温度」,让用户更有在无聊时与她对话的欲望,你从来就不希望和小冰聊天能做到什么,无法定外卖,也查不了明天的天气情况,但是你可以从中收获一些更加有趣的东西,有时是一些暖心的回答,有时是一个个尴尬的冷笑话。

从最开始的一个对话引擎,到能够触达人类各种感官的交互系统,再到现在主打「情商」功能的智能助理,小冰一路走来可能成就了微软自己在最初都没预想过的成绩,它也一直是微软试水人工智能的试验田,直到这个产品成了全球最大的人工智能通用对话系统,微软觉得自己做对了,于是,去年的陆奇,今年的沈向洋,这些明星级的高管纷纷出来为小冰站台,在小冰身上,我们看得到微软的一些想法,也许仍然是试验状态,但微软有心在小娜与「友商」厮杀过的智能助理战场上,开辟出一条新路来。

而就目前来看,虽然你可能对第五代的小冰仍然不满意,但一代又一代,小冰已经成长了太多,对小冰的未来,我们可以提前做一个判断,就是在人工智能的 EQ 这件事上,认真的微软真的做对了。

最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。