出门问问李志飞:把虚拟个人助理塑造成人是不现实的

摘要

从技术的角度来看,一个比较现实的判断是,要在 2025 年实现「Her」是非常难的。

人工智能的概念正在席卷世界,从商业到科技,从企业到媒体,我们能看到 AI 的信息越来越多,但各种报道占据眼球的同时,似乎会感到离 AI 还是有一定的距离。

无人驾驶,智慧医疗、智慧城市,这都是一些 to B 的应用。在 to C 领域,与我们最近的就是虚拟个人助理。2011 年 Apple 在 iPhone 上发布语音助手 Siri,引发了大众对虚拟助手的热情。

《她》(Her)是一部美国的科幻片,讲述一名男子与人工智能之间的爱情故事。影片虽然是虚构 2025 年的场景,但的确反映了现实生活很多人的孤独。

这也引发了一个思考:我们离善解人意的「Her」还有多远?


无处不在的「Her」

在极客公园 Rebuild 2017 大会上,出门问问创始人 & CEO 李志飞以一个 AI 创业者的角度,讲述了他对未来人工智能的看法。

影片中的人工智能 Her 具备几部分的能力:

1、Her 可以与人自然交流。

2、Her 能够理解人类的意图。

3、Her 有自己的思想。

4、Her 无处不在。

李志飞认为,我们现在距离实现这种程度的人工智能还很遥远。

人和机器对话这件事看似简单,但其背后需要用到的技术非常复杂,涉及语音识别、自然语言理解、语音合成、内容方面的集成,这些只是解决了人和机器的正常对话。

「Her」是有想法的。她有自己的意识,能理解人类的话,甚至可以在某些场景下可以提出一些自己的建议。这个功能的实现除了表象自然语言交互的技术以外,还模拟了人类大脑思考、理解、推荐、推理,甚至还有创意、爱、恨等能力。

今天所有虚拟个人助理的技术还只停留在交互层面。它需要一个硬件作为载体,比如手机、耳机、摄像头、音箱。李志飞认为,单一的设备很难承载所有交互,未来无论交互的方式还是设备,都会是多元化的。

XIAG1716.jpg

交互的方式可以是语音、手势、图像、视觉、表情,未来可能是综合式的。语音在今天好像更重要一些,最近国内外几家互联网公司都推出了自己的智能音响产品,出门问问也是选手之一。


把让 AI 落地到生活,这才是最好的体验

出门问问是一家拥有自主语音识别、语义分析、垂直搜索技术的人工智能公司,由前 Google 科学家李志飞在 2012 年创立。在过去五年中,出门问问经历了几个阶段的探索。

XIAG1717.jpg

2012-2014

2012 年出门问问从微信公众号开始做语音识别,在微信上听语音的用户习惯已经非常成熟,出门问问将技术移植到微信的尝试也获得了成功。2013 年,出门问问成为十大微信官方推荐的服务号之一。

2014-2015

出门问问开始把重点转到 Android 和 iOS App 的开发上,2014 年 5 月,出门问问语音助手 APP 登录 iOS、Android Wear、Google Glass 等平台。2015 年,搭载搭载 Android Wear 的第二代 Moto 360 智能手表发布,出门问问与 Google 在语音搜索方面达成独家合作,成为国内 Google Now 的替代选项,中国用户无须代理也可顺利激活 Android Wear。同年 6 月,出门问问进入硬件市场做起了智能手表 Ticwatch。

2015-2017

出门问问在 2016 年得到 Google 的投资,并成为 Android Wear 的官方合作伙伴,「软硬结合」的人工智能产品化道路愈加清晰。今年 4 月份,出门问问获得大众汽车 D 轮 1.8 亿美金融资,与大众成立合资公司,以更深入和落地的姿态进入车内智能交互领域。这让出门问问在车内交互领域占得先机,成为国内 AI 创业公司中的独角兽之一。

在极客公园举办的一次论坛中,李志飞曾提到过技术整合的重要性:「我们不仅仅是要做服务,或者算法,我们要来把关于整个硬件和操作系统的算法技术先吃透,然后再做 API。」

从算法到软件,再到软硬结合新模式,出门问问的每次踩点都很准。在李志飞看来,出门问问并不是靠追热点和运气走到今天,「定义下一代人机交互」一直是他们的使命。

李志飞提到,「出门问问在探索一种新的概念,让 AI 最终落地到生活中,也就是多场景的联动。我们在过去建立了软硬结合的能力,这使得我们可以自己掌控所有软硬结合的产品。很多人在讲科技要有人性,科技要有温度,这没什么问题。但如果把虚拟个人助理塑造成一个像人一样聪明,甚至还能善解人意、有爱恨情愁的机器,我觉得这是把整个行业引向一条不可能实现的道路,也把媒体带向天天只讲科幻,不讲现实的状况。」


人机交互的瓶颈

关于真正的虚拟个人助理落地,李志飞认为主要有两个瓶颈,一是技术,二是用户场景。

在四年前出门问问创立之初,语音识别是一个瓶颈,到今天,语音识别技术已经发展到一定程度,不会成为虚拟个人助理的瓶颈。今天最大的技术瓶颈是自然语言的理解。因为计算机不具备常识,对物理世界也没有建模。

在很多场景下,语音交互的活跃度并不乐观。语音交互的 DAU 代表了用户打开设备使用语音交互的比例。在手机上这个数据小于 1%,智能手表是 20%,车载是 60%。这说明一个现象,当语音交互是一个设备最核心的交互方式时,用户才会使用。

CIQI2559.jpg

所以智能车载可能是未来最先普及语音交互的场景,其次是无线耳塞或者智能家居,最后才是手机。回答最初的问题,Her 这样的虚拟个人助理到底离我们有多远时,李志飞是这样说的:

「从技术的角度来看,一个比较现实的判断是,要在 2025 年实现『Her』是非常难的。」

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。