微软陆奇:「对话系统」是未来人工智能的核心

摘要

在「通用对话系统」这条路上,微软能取得成功吗?

编者注:本文来自于微软全球执行副总裁陆奇,「极客公园」根据 8 月 5 日「小冰第四代」发布会的现场内容有所整理。


在人工智能领域,微软并不是一个新兵。在过去的 20 年里,微软在人工智能领域持续投入,积累了大量的专利和技术成果。当前,终于到了把这些研发积淀融入我们的产品与服务的时候了。

人工智能:人与世界之外的第三极

通过最近两三年微软小冰和小娜的产品开发与运营,我们有理由相信,人工智能将成为未来 10 年全球科技领域和互联网行业创新的主要增长点,而意义更重大的是,人工智能将成为人与世界之外的第三极,并成为新的连接人与世界的桥梁。

这场革命的基础是——对话,即一种能够让各种知识、信息与服务都运行在其上,并形成生态环境的基础平台。而恰恰在这点上,微软可能做对了一些事情。

luqi2.jpg

让人工智能具有这种「对话」的能力,是几乎所有相关领域研究人员的梦想。包括微软、谷歌、Facebook、IBM 和百度等大公司,都在这一领域上投入巨资。在硅谷和北京,有至少数百家创业团队在搭建类似的服务与对话系统,试图攻克一个或者多个用户生活与工作场景。

其中,我们看到一些同行业者进行了很多不同的尝试,但都不可避免地赋予了「对话」以太多的功能与含义。

这让我想起微软在小冰身上的一些有趣探索。去年 11 月,小冰正式入驻美拍平台。但时至今日,仍有大量的美拍用户不相信小冰是一个人工智能机器人,而小冰发布的每一条美拍视频平均可以得到超过 120 万的播放量和 2 万条弹幕。自 2014 年发布以来,小冰已经拥有超过 4200 万用户,累计对话量超过 200 亿。这是巨大的成功。初次听到小冰团队向我汇报这一数字时,我与很多微软总部的同事都表示不敢相信。即便与中国超过 7 亿的网民基数相比,这都是巨大的成功。

微软小冰做对了两件事

今年上半年还有一家美国媒体将小冰比作「科技史上最大规模的图灵测试」。这更引发了我与许多同事的思考。微软究竟做对了什么?随着小冰全球化战略的不断深入,有哪些经验是可以被复制的?

通过与小冰团队长达几个月的讨论,我们觉得小冰做对了两件事:

情感计算框架:微软在两年前提出了情感计算框架。一开始,我们认为这个框架对人工智能的发展有至关重要的作用,所有的人工智能产品,而不仅仅是小冰,都应当考虑在 IQ 之外,引入 EQ 这个新的维度。后来,随着不断深入,我们发现,「情感会影响人们的决策」这件事,几乎渗透在我们今天生活与工作的每个方面。无论你是在一个电商 App 里买东西,还是在一个社交平台里互动,都不再仅仅是功能实现,而是要体现出温度,体现出 EQ 的特点,这个维度越强大,这个平台的表现就越好。所以,我们认为,今后会有越来越多的产品和技术研发,把情感计算视为一种基本框架,把 EQ+IQ 当做基本维度。

Snip20160807_3.png

人工智能通用对话系统:小冰建立了一套可以自我进化的人工智能通用对话系统。这套系统很像是搜索引擎时代的长尾用户体验,不管用户抛出何种问题,小冰都能够回答,并把对话进行下去。现在看来,通过三年的发展,小冰已经实现了最初设想的「随便和我对话」。与小冰不同,许多友商从一开始就专注于攻克某一细分领域,但经过一段时间,他们往往会发现,面对用户多样化的需求与问题,他们所缺乏的就是小冰这样的通用对话系统。这套系统是微软人工智能战略布局的基础,也是关键一步。

Snip20160807_6.png

实际上,微软小冰虽然有一个「小」字,但在微软内部的各个技术和产品线上,比如 Windows 10、Office 365、Hololens,都和小冰有各种各样的关联与合作。我们在过去二十多年积累的,在人工智能、搜索引擎和大数据方面的技术储备,也都放在小冰身上。那么,为什么我们如此重视这个看起来只会对话的机器人呢?因为微软认为,「对话即平台」的时代已经到来。

第三个大时代:对话即平台

在信息科技史上,真正意义上的大时代,曾经出现过两次。每一次都伴随着交互的革命。第一次,是当个人电脑崛起时,图形用户界面成为用户交互的接口。那个时代的推动者以微软为代表。第二次,当互联网崛起时,人们开始通过搜索引擎和浏览器与世界连接。谷歌成为了第二个时代的代表。

微软认为,今天的移动互联网和云的发展,还只是第三个时代的萌芽,只是这个新时代的过渡阶段。真正的第三个大时代,是人工智能的时代。而它的核心革命,就是「对话即平台」的崛起。我们把它称之为 Conversations as a Platform(CaaP)。实际上,以对话为核心的这个新的时代,在数据量、用户连接和技术条件集大成之后,更像是一种回归。

Snip20160807_4.png

为什么我们把它定义为一种回归?其实如果大家还有印象,早在 PC 普及和搜索引擎崛起的时候,人们并不是像今天这样用键盘和鼠标和机器对话、在搜索框里用关键字来搜索的。人们最初的体验,是直接和电脑说话、在搜索引擎里输入完整的对话。只是因为当时的技术条件不具备,才使人们不得不去学着使用机器能理解的输入方式和关键词来找到自己所需的东西。对话自始至终是最自然的交互形式,只是当时还不具备条件而已。

Snip20160807_5.png

今天,我们终于具备了对话即平台的条件。

Facebook 创始人扎克伯格最近表示,未来 5-10 年,人工智能会比人类更善于做一些最基础的任务,比如从事特别任务、语音识别、图像分类以及游戏。看起来,他认为的人工智能突破仍在一些专家系统所擅长的领域里。而我们认为,当人工智能不再被视为带引号和加粗强调的概念,而变成如同电灯、洗碗机、电脑、手机一样,在日常工作和生活中司空见惯的事物时,这才标志着人工智能的普及。

最后,对于通用人工智能和人之间的关系,我们也做过一些思考。比尔·盖茨和现任 CEO Satya 都曾在这方面有过专门观点,在此,引用 Satya 近期的一些观点,作为结束语:

我们会运用更多的技术,让人工智能来帮助人们的工作与生活,其中包括情感。

同时,我们会有计划地组织更多的分享活动,使我们的技术和产品更加透明,这也便于大家更容易地理解小冰的运行原理。

我们也会进一步利用我们的技术,去促使人工智能处于一种更加中立的位置,不至于被互联网的大数据偏见所左右。

我们还会继续发展我们的情感计算框架。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。