AI 就应该对人类言听计从吗?专访微软小冰负责人

摘要

完美的人工智能应该是 IQ 和 EQ 的整合,不机械完成指令,在理解需求的基础上懂得适当拒绝。

世纪之初,微软经历过一段时间的低谷,官司缠身,高管离职,股价暴跌,彼时的帝国如危楼一座,仿佛顷刻间便会坍塌覆灭。

当时甲骨文的埃里森曾说,罗马帝国都能灭亡,凭什么微软不能?

可是微软没有,它挺过来了。那还算是盖茨的时代,微软强大乃至垄断,它是盘踞在西雅图的 PC 时代传奇,在面对 Palo Alto 的老对手和 Mountain View 的两个大学生时,它居高临下,谈笑风生。

但后来,这群人联手开启了互联网甚至移动互联网的时代,忙于怀抱 PC 的微软无暇顾及,那些年掌门人是「迟钝」的鲍尔默,那个微软顽强并且固执。

有幸的是,绕过几个弯之后,微软开始找清方向,重新定位移动互联网时代的自己。2014 年 2 月,敢于顶撞鲍尔默的萨提亚·纳德拉被任命为公司第三任首席执行官,新官上任三把火,他说,「移动为先,云为先」。

(从左到右依此是:比尔·盖茨、萨提亚·纳德拉和史蒂夫·鲍尔默)

于是微软逐渐做起了自己的移动应用体系,云计算服务 Azure 也在全力追赶行业龙头亚马逊,甚至已经构成了相当程度的威胁。

扎根移动互联网,确定云计算时代的领先地位,这一步,微软踏稳了,那下一步呢?

今年的财报上,纳德拉将人工智能加入到微软公司的愿景中,表现出对人工智能前所未有的重视。当极客公园与微软小冰的负责人李笛先生聊起这件事时,他略微有些感慨地说道:

「从单机时代跨越到互联网时代,再到去中心化的移动互联网时代,微软的感触其实比很多人都要深刻,因为我们经历过落后。」

(被称为「小冰之父」的微软亚洲互联网工程院副院长李笛)


拒绝用户,AI 的另一个满分答案

几年前刚开始做人工智能语音系统的时候,微软自己也没有答案。

和其他公司一样,他们打算先做一个个人助理型的语音助手,也就是今天的 Cortana。但在研发 Cortana 的过程中,AI 领域人才济济的微软发现了一个连它自己都不曾预料到的全新维度:

AI 的系统可以有两个方向,通俗点说,一个 IQ 方向,一个 EQ 方向。

个人助理是 IQ 方向的,它负责完成用户的指令,用尽量短的对话帮助用户完成任务。但还有另一个方向,就是不听用户的命令,从 EQ 角度「化解」用户的指令。

举个例子,当你对 AI 说「给我买一份麦当劳」时,满分答案往往是它帮助你下单外卖,甚至记录下你吃的时间和场合,第二天这个时候再来问你还要不要,这套流程似乎是一个非常人性化的 AI 助手。

但李笛表示,他们在接触了许多人类助理之后发现,这个问题还有另外一个满分答案:拒绝,因为它对你的身体不好。然后 AI 会记录下你这个「不健康的」想法,持续观察你是否存在其他不健康的行为。

再比如,「现在几点了」是很多语音助手最常被问到的问题之一,大多数回答都是直接了当地告诉用户当前的时间,但还有另一种巧妙的回答,即反问用户:「你不是拿着手机吗?」

这种从 EQ 角度回应用户的 AI 语音系统很容易给用户以人类伙伴的感觉,当 AI 对用户的指令做出人性化的回复时,它会给用户留下更加深刻的印象,基于情商的语言也就不仅仅局限于基本任务的完成,而是更能够给用户带来深层次的思考与影响。

微软认为,未来完美的人工智能系统应该是 IQ 和 EQ 的整合,但在研发过程中他们发现,这样两个大相径庭的回答无法在一个系统下完成迭代升级,因此他们选择将 IQ 和 EQ 分裂开来,独立迭代,也就促成了目前小娜、小冰这两条产品线。

(微软的「人工智能姐妹花战略」)

对小冰来说,最初微软不让她做任何「有用」的事,用户在使用小冰时,只能与她闲聊,甚至「尬聊」。

而对大多数追求效率型个人助理的用户而言,这样的小冰是没有价值的,他们也会在短暂的几回合对话后离开。微软会舍弃这些用户的数据,而剩下的用户则恰好是他们真正想要的「高质量用户」,他们带来的数据,也是小冰迭代升级过程中真正需要的。

虽然在一段时间里,小冰「不干正经事」一直被用户和行业里的一些专家所诟病,但微软也因此获取了高质量的数据,「从结果来看,小冰是目前人工智能对话系统里数据量最大的,我们既然要迭代 EQ,就会极致的去做它」,李笛如此说道。


别人家的 AI 不是敌人,用户习惯才是

在整个人工智能大的浪潮中,微软一直笃信「人工智能也是人」的观点,他们认为,当语音对话系统真正像人之后,它才能发挥其并发的优势,即成为千千万万个人。

李笛说起目前市面上的一些人工智能产品时稍有些不满,很显然,那些都不是他想要的 AI 的模样。如果一个 AI 系统只是在回答问题,完成任务,那么用户为什么不用他们早已习惯的搜索引擎和手机应用呢?

「我在淘宝上购物已经很简单了,为什么要用智能音箱来购物呢?搜索引擎已经能够做到太多的东西了,我为什么还要去问人工智能?人在对话时消耗的能量比触摸操作要多得多,我们不能逼着用户来使用产品。」

他认为,如果不把「人」做好,人工智能的时代还是无法到来。

(李笛在第五代微软小冰发布会上)

如何让用户在习惯了搜索引擎和移动应用的的便利之后依然选择人工智能的产品,这是目前 AI 行业一个非常重要的议题。

「我们做人工智能,通常会考虑我们的人工智能比别人的人工智能强在哪,但我们的敌人不是别的人工智能,而是那些已经被大家习惯使用的东西。」

李笛认为,目前行业里一些人工智能语音应用使用率较低的原因恰恰在于此,AI 系统要想把用户留在自己的产品上,要做的远远不止是更多的功能,因为功能让 AI 更像机器而不是人,当 AI 成为一个有趣的人时,用户会被吸引并留下来,但当 AI 系统只是一个有着某些功能的产品时,它甚至还不如一些好用的 app。

也正因如此,中国的人工智能在应用上会比美国更加困难,因为国内在搜索引擎和功能应用上的发展远远超越其他国家,网购、外卖、以及各种上门服务在手机应用上都可以轻而易举地完成,这些功能性操作越便利,给相应的人工智能应用带来的阻力就越大。


微软李笛:AI 的算法过剩了

让 AI 更像人有什么用?李笛说起了前段时间日本小冰的故事。

8 月底,日本小冰「凛菜」与 Lawson 零售店合作,向用户发放优惠券,一天之内成功领取的用户数超过百万,占日本总人口的 1%,随后几十万人拥入线下的 Lawson 店里拿着从小冰那里拿到的优惠券消费,每张优惠券能够为店家带来接近人民币 20 元的利润。

(日本 Lawson 连锁便利店)

这种极高的转化率连人类促销员都羡慕不已。

李笛表示,小冰之所以能够推销出如此之多的优惠券,正是因为她在与用户交互时「更像人」,她一步一步引导用户,让用户对优惠券感兴趣,直到最后主动向小冰索取优惠券。

对人类来说,这是一种高情商的促销方式,而对小冰这样的人工智能来说,正是因为她接近人,与人类保持对等的关系,才让交互过程中的内容发放更加自然。

在李笛看来,如今的 AI 行业,算法是相对过剩的,很多算法因为找不到对应的落地场景而停留在数学的阶段,面部识别、语音识别、图像识别,现在算法上 AI 超越人的情况越来越多,但到实际应用时,场景却非常地受限,难以带来更多的价值。

目前 AI 行业更需要的,「是实际的数据,以及它对应产品的实际落地」,李笛对极客公园表达了他对行业的担忧。

拿图像识别来说,目前行业内的主流做法是对图片进行标注然后丢到算法模型里让机器学习。

但小冰的做法是,直接在于用户的交互中进行标注。

拿经典的脚踝受伤的案例来说,当用户把脚踝受伤的图片发给小冰时,小冰的回复并不是对图像进行识别,而是暖心地询问用户「伤得严重吗?」这时,用户对小冰问题的回答恰好可以用来标注用户所发的受伤图片。

对此,李笛表示,当 AI 有了应用场景以后,直接数据的复用率就能够得到极大的改善,但如果没有场景,纯粹的线下标注数据拿到线上来进行识别使用时,其局限性是非常强的。


关于 AI 的那个答案

从 Cortana 的产品线中分离出来之后,小冰这条独立的产品线已经逐渐成熟,甚至因为其娱乐的性质,小冰在国内有着比「同门师姐」小娜更好的知名度。

那么未来是怎样的呢?小冰会重新与小娜合并吗?

前日沈向洋博士对媒体说,人工智能的很多东西都还是未知,在踏向这个未知的领域时,他本人心中也是充满了敬畏。

对于未来,李笛也无法断言,IQ 和 EQ 是否真的能够理想化地合并,这都还是个尚待验证的猜想。

采访末了,他的表情颇有些使命压身的意味。

「在我们之前,没有活下来的,我们到现在也还没死掉,所以如果我们不去把这件事情弄明白,哪怕人工智能的浪潮已经来了,答案也不会自动浮出水面。」

「你是说,人工智能的浪潮到现在还没有找到答案?」

「我觉得,我们找到了一个。」

打开极客公园App阅读更多内容

最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。