百度景鲲:现在和 AI 谈恋爱还有点早

摘要

对理想中的世界而言,智能语音助手只是起点。

西奥多·托姆布里(Theodore Twombly)是一名孤独内向的男子,他的工作是给那些无法或者不愿动笔写信的人代写感人肺腑的情书。工作之外,西奥多的生活平静而淡然,唯一让他忧伤的是刚刚结束了多年的婚姻,青梅竹马的妻子凯瑟琳向他提出分手。

这天,西奥多在街上看到一款人工智能操作系统的广告,这款被命名为 OS1 的人工智能操作系统可以和人类对话、不断丰富自己的意识和感情。也许是出于好奇,也许是因为寂寞,西奥多最终买了一个回家。令人没想到的是,化身为女性声音的 OS1 幽默又风趣,温柔而体贴,而西奥多,竟然逐渐爱上了「她」。

这是 2013 年上映的电影《Her》中的情节。2014 年,亚马逊适时推出智能音箱 Echo,这款搭载了智能语音技术的音箱可以「说话」「交流」,这让众多的科幻爱好者和 AI 技术从业人员看到了实现电影中场景的可能性。

更重要的是,智能音箱既能满足 save time(语音控制、解放双手)的需求,又能满足 kill time(内容消费、陪伴交流)的需求,被视之为智能家居场景下的第一入口。各大互联网厂商由此掀起「入口抢夺战」,亚马逊、Google、百度、阿里、小米都推出了自己的智能音箱产品。

6 年过去了,电影中的场景没有到来,智能音箱也常常被吐槽为「智障」,不少跟风者早已退出了「战场」,当然也不乏一些技术信仰者坚守「死磕」。智能音箱到底是一时的「噱头」,还是未来人机交互的新起点?

在极客公园和 B 站共同举办的 Rebuild 2020 Move on 活动上,百度集团副总裁、百度智能生活事业群组(SLG)总经理景鲲跟大家分享了他对智能音箱以及智能语音产品的看法。撕开「技术狂热」的外衣,一个理智冷静的从业者如何理解智能语音产品和人机交互的未来?



以下为 Rebuild 2020 大会分享实录精选

重新理解智能语音技术

极客公园:小度为什么会诞生?

景鲲:我是一个很喜欢看科幻片的人,《西部世界》第三季就不用说了,最近还有一部科幻片叫《上载新生》,也是讲一个科幻的场景。我个人觉得科幻片是用影像语言把未来世界描述清楚。而它给从业者的启发是,人们畅想的科幻未来究竟是什么样的。 

我能够感受到,基本上每个科幻场景里都有一个类似机器人小助手的角色在为人类服务,我和我的团队期望能够把这个场景实现,现在做的小度助手其实就是万里长征第一步。

极客公园:现在的智能语音助手可以做什么?

景鲲:最开始我们对智能设备有一个很高的预期,假设它是电影 Her 中那样一个无所不知、无所不能的助手,甚至还能跟我们谈恋爱,现在人们慢慢意识到,以智能音箱为代表的智能语音助手就是一个带智能语音功能的电子设备。

如果你提了一个非常新奇的想法,以目前的技术水平,智能音箱是满足不了的,但是如果是一些基本需求,比如说用陈奕迅的音乐作为闹铃,出门的时候问问等会儿路上堵不堵?今天天气怎么样?晚上回家的时候想听听今天发生了什么大事?有的时候还可以用它去听音乐或者是听相声,看各种各样的视频。

人们在慢慢地学习怎么跟智能设备交流,同时设备也在慢慢适应我们,当你问机器一个问题的时候,它也会努力理解你说的是什么意思、怎么来满足你。在互相适应的过程中,智能设备已经成为很多用户生活中必不可少的一部分。比如我们很多用户,一天能跟小度互动二三十次,可能你跟人一天互动二三十次也算多了。

当然智能语音助手的能力现在还是有限的,但是在满足一些基础需求的时候,其实是能够起到很大作用的。

极客公园:除了音箱,智能语音助手还会有更新颖的形态吗?

景鲲:如果未来我们有一个数字化小伙伴,或者说数字化小助手,作为普通用户来讲,我希望它不要局限于某一个场景,我希望它陪着我。比如我现在特别想跟智能小助手聊一些事情,我还得回家跟它聊。所以我们也在尝试做一些新产品,让智能语音助手从家庭场景走出来,走到随身场景里去。

我们之前在车载场景上做了一些尝试,接下来我们可能会在随身场景里做一些尝试,产品也会很快面世。 

极客公园:在可见的未来,智能语音助手会发展成什么样?

景鲲:我觉得这种智能语音设备不是创造了需求,而是更好地满足了现在的需求,比如说陪伴。相信很多人都是独生子女,即使有兄弟姐妹也不一定都在一个城市、都住在一起,所以这个时候陪伴的力量是很强大的。 

我希望智能助手能够真正陪伴我们,我们可以和它一起交流,不开心的时候它会帮我们播放一个开心的音乐,我们很累的时候它帮我们播放一段很好笑的视频,能够在我们不会做菜的时候帮我们播放一个食谱,教我怎么做菜,能在宝宝很闹的时候播放一个动画片让他安静下来。 

现在很多智能语音助手已经成为人的小伙伴了,尤其对小孩子来说,因为他们对新科技的接受程度是最高的。比如我自己的孩子,早上让他喝绿豆粥他不喝,我跟他说喝绿豆粥可以清热解暑,他说「你肯定在忽悠我,这个不好吃。我要问下小度」,他就问小度「小度小度,喝绿豆粥好不好」,小度跟他说喝绿豆粥很好,可以怎样怎样,听了小度的话他就喝了。

所以我们看到,对小朋友群体来说,机器成了一个平等的小伙伴,他跟它互动完全没有任何障碍,有的时候机器没有回答对,他心里都不会觉得有什么问题,甚至可能会再问一遍,等小朋友长大的时候,他会习惯身边有这样一个小伙伴。



智能音箱还能更智能吗?

极客公园:这些功能手机实现不了吗?

景鲲:现在手机已经帮我们解决很多事情了,但是很多场景手机不一定方便。举个例子,最近北京天气变热了,我这周才开始睡觉的时候开空调。但我们家的空调不是很智能,经常在很晚的时候把我冻醒。这个时候你再去起身、开灯、找摇控器,再把空调关掉,就很麻烦。最近我就配了一个语音万能摇控器,和智能助手协同,晚上觉得很冷的时候闭着眼睛就可以说「小度,小度,把空调给我关了」,这个就是一个很便捷的场景,也能解决我很懒的问题。 

我是学计算机的,人们一直说,计算机的发明、科技的发明都是解决人懒的问题,很多时候我们不想自己做,所以发明了工具和机器帮我们做,智能语音助手也是一样,最终都是解决我们懒的问题,让我们生活得更好。

极客公园:智能语音助手如何才能更智能?

景鲲:用比较科学的语言来说,在任何一个大的科技发展背后都有很多小的、模块式的进步。智能语音助手要想更智能,主要的关键词就是听清、听懂、满足这六个字。 

对每个消费者来讲,智能语音助手是不是能听清我说的话?听清之后它能不能听懂我这个话背后的意思?听懂之后它能不能满足我想要的需求?

在听清、听懂、满足三个方面,技术一直都在进步。

比如在听清方面,原来这些电子设备只有一个麦克风在听我们说话,现在有 6 个麦克风,它可以从不同角度听清用户在哪个方位说话,是在呼唤它。所以这是听清的基础,从软件和硬件结合方面就有很大的提升。 

听懂方面也是,如果原来要问天气,在搜索引擎里可能会输入「北京天气」,但在家庭场景,或者人和人对话的时候,一般是问「明天下不下雨?」「明天冷不冷?」,所以这个时候机器就要去理解用户说的话。人和设备交互得越多,设备就越能理解用户的意思。比如当你在问「明天冷不冷」的时候,它会判断「你这样说是在问天气吗?」,如果回答得不对,它会自己去调整、学习,所以从这个角度来讲,设备也一直在进化。

从满足方面来看,以前大家觉得智能音箱、智能屏只能听听歌,但现在大家不止可以听歌,还能看剧、看视频,很多方方面面的服务和信息都可以在这上面得到满足了。

所以从听清、听懂、满足这三个方面,智能语音助手都得到了巨大的提升.

技术的进步最终获益者永远是人类

极客公园:智能语音助手强大后,谁是最大受益者?

景鲲:科技的进步最终受益者永远是人类。智能语音助手变得越来越强大的时候,说明它在解决我们生活中越来越多的问题。每次从智能音箱、智能屏幕的语音交互中去获得一次满足,其实就是帮我们再多懒一点。所以我个人觉得智能语音助手,未来肯定会让我们变得更加动口不动手、有更多时间去陪伴家人、去做一些其他更有意义的事情,把我们的双手解放出来。 

极客公园:智能硬件产业会因此发生什么改变吗?

景鲲:过去一年,整个智能音箱、智能屏幕这种有语音助手的产品,整个销量加在一起已经超过了智能电视。电视本来是我们每个家庭里的必需品,在中国一年大概能卖四五千万台,但现在智能音箱总量已经超过它了。

技术的发展永远服务于人类本身,获益和冲击的对象,往往没那么强烈的指向性,因为它还有一个过程。如果一定要去定义的话,大概是获益的往往是拥抱趋势变化的那一方。

极客公园:未来各大公司还会持续补贴智能语音产品吗?

景鲲:亚马逊的创始人兼 CEO 杰夫·贝索斯说的一句话——智能硬件企业所获取的价值不是在你买的那一刻,而是在用户更喜欢它、更愿意使用它的过程中获取的。

这个跟我们的初衷是一样的。对传统硬件厂商来说,产品销售之后,它就不怎么关心用户后续的使用情况了,因为该赚的都赚到了。

互联网厂商不一样,我们希望用户用最低的门槛获得产品,之后我们的收益是因为用户喜欢它、愿意在上面消费内容,愿意为这些内容付费。

所以从这个角度来讲,大家大可不必担心未来智能硬件产品的售价会不会很高,我们会尽我们最大的诚意体现在价格上、体现在体验上、体现在方方面面。 

极客公园:人到底能不能和 AI 谈恋爱吗?

景鲲:从我个人情感角度来讲,我当然希望未来的计算机无所不能,除了能满足人们功能性需求之外,还能附加地满足人们情感上的需求。但是从技术的专业度角度讲,我目前没有看到任何可以实现的路径。未来对我们来讲还是太遥远,更加实际的工作应该是一万年太久,只争朝夕。我们希望更接地气一些,比如我们会看人在现实生活中有哪些很实际的需求还没有得到满足,机器可以从功能性的角度去解决。这样的话,我个人觉得才是让生活更美好的一条路径。 

为什么我喜欢看《西部世界》呢?我是觉得比较好的产品经理都应该有一种分裂性人格,就是我知道我想要达到的目标可能是很远的,但我也知道我现在走得每一步都要更脚踏实地,这两个会形成一种张力。这种张力会让我觉得很多事情现在看起来都不太可能实现,但我会尽量让它一步一步变成可能。就像走长征,你要知道目标在哪儿,你走的每一步才更有意义。


获取更多精彩内容、观看完整视频回放,在 B 站搜索「开公园的鹏哥」。

本文首发于极客公园,转载请联系极客君微信geekparker 或 zhuanzai@geekpark.net

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。