对话 DeepMind 创始人 Demis Hassabis：AI 将会如何重塑我们的世界？

编者注：这一周以来，全世界的目光都聚焦在韩国首都首尔，都聚焦在那个韩国棋手与那位人工智能「狗」之间的比赛上。而这个「阿尔法狗」背后的英雄正是英国人 Demis Hassabis，他也是开发出 AlphaGo 的英国公司 DeepMind 的联合创始人。在 3 月 8 日的第一场比赛之后，The Verge 对他进行了专访，其中 Hassabis 谈论了许多有关 AI 领域未来发展的问题，非常值得一读。

本文编译自 The Verge，原文标题为「DeepMind founder Demis Hassabis on how AI will shape the future」（http://www.theverge.com/2016/3/10/11192774/demis-hassabis-interview-alphago-google-deepmind-ai），转载务必注明本文和原文链接。

DeepMind 在与李世石的围棋比赛中的胜利又激发了人们对人工智能潜力的遐想。但是，Google 的这个名为 AlphaGo 的项目只是它很小的一个计划而已——甚至不是主要的那一个。就像 DeepMind 联合创始人 Demis Hassabis 所说的那样，DeepMind 想要去「解决智能方面的问题」，而且对于如何完成这一任务，他的办法可不少。

为了完成这一目标，Hassabis 自己有一个不同寻常的成长路径，但是当我们回想起来时，我们会觉得这一切不能再完美了。作为一个在象棋方面堪称神童的小朋友，他在智力运动会竞赛中赢得了总冠军；之后，他在很年轻的时候就凭借开发出了几款电子游戏在英国一举成名，自然而然的，他建立了自己的工作室：Elixir；再之后，在 2005 年左右，Hassabis 离开了游戏行业，在神经科学领域读了一个博士学位，然后他创建了 DeepMind。

在 AlphaGo 与李世石比赛的第一场胜利之后，Hassabis 接受了 The Verge 的访问。在 Hassabis 的想法里，媒体这方面的事儿永远排在最后，但当他走进房间的时候，他还是很开心的样子，嘴里还一边评价着四季酒店的装饰；而当有 Google 的工作人员告诉他昨天晚上有超过 3000 篇的文章关注了 AlphaGo 的比赛时，他表示了震惊。「这难以置信，对吧？」他说道，「看到这种有些深奥的东西变得受欢迎，这还挺有趣的。」

在 AlphaGo 以外，我们的对话还涉及到了视频游戏、下一代的智能手机助手、DeepMind 在 Google 中扮演的角色、机器人、AI 怎样帮助科学研究等等。总之，这是一次深入的对话。

曾经是游戏界大神，现在他想要改变整个 AI 世界

到目前为止，对于那些还不了解 AI 或围棋是什么的人，你如何从文化共鸣的角度为他们描述昨天所发生的一切？

Hassabis：有一些事是我必须要提到的。围棋堪称是一种完全信息博弈的巅峰之作，仅就可能性来说，它的复杂程度远胜国际象棋，所以对于自从「深蓝」之后的 AI 研究来说，围棋一直是一个重大的挑战。正如你所知的那样，即使我们已经付出了很大的努力，但我们所走的路还是很有限。蒙特卡罗树搜索是我们在 10 年前得到的一个重要创新，但是我认为我们为 AlphaGo 所做的是为其引入了神经网络中的直觉部分，而这才是真正能够成为顶级围棋选手的条件：直觉。当我看到麦克雷蒙在解说时也在计算目数时遇到了困难，我觉得挺惊讶的，你要知道，他可是一位围棋九段选手！而这也表明了想要为围棋写出一套「价值网络」体系（valuation function）有多困难。

AlphaGo 有下出了任何让你感到吃惊的行动吗？

有的。当 AlphaGo 穿越棋盘进入李世石占据优势的领地时，我们感到相当震惊，而且我认为从李世石的面部表情来看，他也很震惊。我认为那绝对是出乎所有人意料的一招。

是因为那代表了一种侵略性吗？

也许是因为它的侵略性和胆大妄为吧。它在同李世石的比赛中使用了李世石式的下法。要知道，李世石就是以具有创造性的战斗方式闻名于世的，而这也是他昨天想要展示出来的地方，我们对此也很期待。从比赛的一开始，布局未稳之时，他就几乎在所有的地方都展开了激战。但传统的围棋程序并不擅长这种下棋方式，他们在本地计算时也不差，但它们通常都缺少对整个棋盘的大局观。

你们举行这五场比赛的目的就是要去评估 AlphaGo 的能力，无论输赢。那你们从昨天的比赛中得到了什么？

我猜我们学到的就是我们要沿着这条路继续向前走。你可以这样说：这并没有超出我们的预期，但这也是我们所希望看到的。我们在赛前表示这场比赛胜负难料，大家都有 50% 的几率获胜。我仍然认为我们说的没错，任何事都可能发生，而我也知道李世石在今天的比赛中一定会调整战术。所以我对接下来的比赛仍然充满兴趣。

让我们来谈谈到 AI 的意义吧。你也许听我谈起过 AlphaGo 和「深蓝」之间的差异，「深蓝」是一个手工操作的程序，程序员需要将国际象棋大师们的信息提取出来，将它们转化成为具体的规则和启发；而我们的 AlphaGo 则拥有更多的学习能力，它能够通过实践和学习获得成长，这是它更为人性的地方。

如果接下来的比赛继续以这种 AlphaGo 取胜的方式结束，那你们下一步的计划是什么？你们会在未来开发另一款 AI 对战的游戏吗？

我认为，对于完全信息博弈（perfect information games）来说，围棋已经是巅峰了。当然，也许还有其他的围棋高手等着我们去挑战。但对于其他的游戏来说，比如没有限制条件的扑克，那就非常困难了，因为那是一种不完全信息博弈的游戏。而且也还有不少人类比计算机玩得好的项目，比如视频游戏，《星际争霸》就是其中一例。这种策略类的游戏在信息不完全的世界中需要一种更高层级的战略能力，也许我们可以称之为「只观察部分的情况」。而围棋就没那么复杂了，你能看到棋盘上的一切，因此，计算机玩起来会更容易一些。 DSCF3953.0.jpg

挑战《星际争霸》是你自己感兴趣的事吗？

也许吧。我们只对在我们研究主轨道上的项目感兴趣。因此，DeepMind 的目的不是打游戏、找乐子、取悦观众，虽然它能做到这一切。从我个人来说，我喜欢打游戏，我曾经开发过电子游戏。但是我们主要是将游戏作为一个测试平台，以此，我们能试着去写算法、也能测算出它们的架构和能力。总之，游戏是一个非常有效的测试方式。但最终，我们还是希望将其应用到现实生活中去。

我再 1990 年代末的英国长大，因此我能看到不少电脑杂志和许多电子游戏。因此，当我第一次见到 DeepMind 和你的时候，我想：「你们可真是天生一对。」你之前在游戏行业中的经验和你现在所做的事有关联吗？

是的，像 DeepMind 这样的事一直是我的终极目标，我为此计划了 20 年。如果你始终观察我在 AI 领域所做的这些事，那你会发现它们都有自己的作用。如果你对我之前开发的那些游戏有印象，你会知道 AI 就是我所做的所有事的核心部分。我们的游戏卖出了上百万份，这是因为我们将 AI 融入到了人们玩的游戏当中。之后，我又回到了校园中去学习神经科学，那是因为我感觉在 2005 年左右，我们应该在 AI 领域中走的更远，但我当时却还被要求去做游戏，因为你的出版商们只想要游戏。

是不是因为在那个时代，游戏就是 AI 最显著的应用领域？

我想是的，而且我认为我们当时所做的就是最顶尖的 AI 技术。我想说在当时，学术水平还停留在 90 年代，而这些新技术还没有真正得到普及，比如神经网络、深度学习等等。因此，最好的 AI 技术就在游戏领域。那不是现在这种学习型的 AI 技术，它们都还是停留在有限状态的机器，但它们已经很复杂了。像 Black & White 这样的游戏已经使用了强化学习技术（reinforcement learning）。但是，在 2004、05 年的时候，游戏行业发展的方向已与 1990 年代大为不同，1990 年代的游戏行业很有创造力、也很有趣，你能实践你的任何想法。但到了 2005 年左右，人们都将注意力放在了图像及版权这些方向上，所以它就不那么有趣了。我已经为了游戏付出了一切，而现在到了为 DeepMind 做准备的时候了。而我选择的方向就是神经科学，我想要从「大脑是如何解决问题」这个方向上获得灵感，所以我想，还有什么比去读一个神经科学博士更好的方法呢？ DSCF3940.0.jpg

在本周，你提到说 AI 未来的应用领域将会集中在医疗保健、智能手机助手以及机器人这些行业，让我们来聊聊这些吧。为了提升医疗保健水平，像 IBM 和 Watson 这样的公司已经开始了有关癌症诊断方面的工作，DeepMind 能带来什么呢？

嗯，目前它还处在初级阶段。我们前几周才和 NHS（英国国家医疗服务体系）展开了合作，但那只是开始构建一个机器学习的平台而已。在我的理解中，我觉得 Watson 和我们做的完全是两码事，他们所做的更像是一个专家系统，那是一种完全不一样的 AI 样式。我认为这种 AI 是通过图像去诊疗癌症，之后它也许能够纵向跟踪你的生命特征，然后帮助人们拥有一个更健康的生活方式。我认为这非常适合强化学习技术（reinforcement learning）。

和 NHS 成为合作伙伴，你已经宣布开发了一个 App，但它似乎并没有太多 AI 或者机器学习的技术。你们是怎么想的？为什么是 NHS 而不是其他人？

嗯，NHS 的软件系统在我看来就是一团糟，因此我想我们要做的第一步就是将其带入 21 世纪。他们不是移动的，他们和消费者所理解的处理方式也完全不一样，对于医护人员来说也非常糟糕。因此我想第一步还是去帮助他们使用更有效的工具，比如可视化工具和基础统计工具。我觉得我们已经做到了这一点，之后我们会将更复杂的机器学习技术带入其中。

创造新的智能手机助手

让我们再聊聊智能手机助手吧。我发现你在当天的演讲当中使用了电影《她》的一张图片，这难道就是最终的结果吗？

当然不是，我的意思是说《她》是现在主流的观点。我只是觉得我们想让这些智能手机助手变得智能、能情境化并且可以对我们想做的事有一个更深的理解。而目前，大多数的系统还非常脆弱，一旦你使用了他们没有预先编程的模板，那他们就完全没用了。所以这还是有关实用性、灵活性以及可靠性的问题。

那你们需要什么样的突破以提升它？为什么我们不能再明天就用上它呢？

事实上我们是可以的，我只是觉得我们需要一种不同的方式。再说一次，这是在预先编程和自我学习之间的对立，而目前，几乎所有的智能手机助手都采用的是预先编程的方式，因此它们也非常脆弱，，因为它们只能做已经编程好了的事。但真实的世界是非常复杂的，用户会用你做许多你意想不到的事。而我们对 DeepMind 的坚信就在于这个基本原则：你研究智能的唯一办法就是从根本性和普遍性上学习。

AlphaGo 成功的方法是学到了许多不同的游戏模式，但这种方法如何应用到智能手机当中呢？毕竟人们向智能手机输入的内容五花八门。

我同意你的意见，因此数据量非常大，而你可以从中进行学习。事实上，我们将会在接下来的几个月继续调整 AlphaGo 的算法，我们认为我们可以摆脱监督式的学习方式，能够完全做到自我发挥，能够从一张白纸成长起来。这段路可能会很长，因为你需要测试和犯错误，所以也许我们需要几个月的时间。但我们觉得让 AlphaGo 由纯粹的自我学习成长起来是可能的。

这可能吗？你们的算法已经达到这个程度了吗？

不，我们可以在算法没达到之前就能完成。因为它不是开发出更强大的程序，我们只是让它使用纯粹的学习方法。我们认为目前的这个算法能够在没有监督的情况下运行。

这会更容易吗？比如它的失败迹象会更明显吗？

它会更容易，因为分数会变得更规则。在围棋中，想要判断你的胜负，你只需得到一个分数就够了，这被称为所谓的「信用分配问题」，它的问题在于当你在围棋中下了一百颗棋子之后，你并不知道哪些是让你赢的、哪些是让你输了的，因此，判断的信号会变得相当微弱。而在其他的一些游戏中，你所做的大多数举动都能给你一个分数，因此你会有效仿的对象。

你能给出一个时间表吗？合适人们才能在手机上见到这些变化？

我认为在接下来的两到三年中，人们就能见到这些变化。我的意思是，它的开始是很微妙的，只是让某些方面变得更好了而已；但也许四到五年之后，你就能开始看到一些大的变化了。 DSCF3689__1_.0.jpg

根据你所确定的未来的可能性，这会是让你们同 Google 连接起来成为一个整体的那一部分？

是的。

你有没有得到任何的指示去让你上面提到的这些技术契合到 Google 的产品路线图中去？

没有，对于我们想要做的事，我们拥有非常自由的选择权。那就是我们的使命，也是我们选择加入 Google 的原因，在过去的几年它从未改变。当然，我们也同许多 Google 内部的产品一起工作，但它们还都在非常初级的阶段，因此 Google 还不想谈论这些。智能手机助手当然是我认为非常重要的核心部分，我也认为 Sundar Pichai 也已经多次谈论过将其作为 Google 未来发展的核心了。

Google 自己也有一些创新部门，比如 Google Brain，它们也面向用户推出了像 Google Photos 这样的机器学习产品。

这样的产品到处都是。

你觉得你们和 Google Brain 有互动吗？你们之间的工作有重叠的地方吗？

当然有了，事实上我们是非常互补的部门。我们每周都有交流。Brain 主要关注在深度学习方面，而他们也有像 Jeff Dean 这样杰出的工程师，因此他们能融入到公司的每一个角落中，这也是为什么我们能见到 Google Photos 这样优秀的产品的原因。他们目前正在着手进行一项非常重要的工作，因为他们的部门在 Moutain View，所以他们离产品部门更近，他们也有 12-18 个月不等的研究周期。而我们则更多的关注在算法开发上，我们想要做的事通常时间周期都在两到三年之间，我们不需要在一开始就关注在产品上。

Google 对 AlphaGo 的帮助大吗？如果没有他们，你能完成这项工作吗？

Google 的帮助当然很大。AlphaGo 在硬件上的运行要求并不大，但是我们需要很多的硬件设施去训练它、去测试不同的版本并且在 Google 的云端进行比赛训练。这些都对于硬件设施有很高的要求，因此我们不可能在没有这些资源的情况下、在这个时间范围内完成它。 DSCF3672.0.jpg

改变机器人的世界

再让我们聊聊机器人吧。我驻扎在日本，这里被认为是机器人的精神家园。我认为机器人目前在这个国家在两个方向上被使用，Fanuc 这样的公司制造工业化机器人，他们能够在一个固定用途上做出令人惊讶的工作；而像软银的 Pepper 这样的公司则开发一些礼宾式的机器人，他们很有野心，却又用途有限。那你的想法是什么？

是的，就像你所说的 Fanuc 一样，他们的产品拥有很出色的身体机能，但缺少的是智慧。而那些礼宾式的机器人则更像是智能手机助手，都是使用模板进行预先编程那种样式的，如果你做了什么他们无法理解的事，他们会非常困惑。

所以我猜目前最显而易见的问题就是像机器学习这样的技术如何才能推动机器人的能力发展。

这是两种完全不同的思路。我们人类从基础上就拥有了学习新事物和应对突发事件的能力，而我认为这才是机器人或者软件在真实世界中所需要具备的能力，他们也需要拥有正确使用这种能力的方法。我觉得机器人的学习路径最终会走上正轨的。

目前你能看到的最直接使用学习方法的机器人案例是哪个？

我还没太想过这个问题。显然自动驾驶汽车会是其中的一种，但他们目前使用 AI 的场景太有限了，尽管它们能在计算机视觉方面使用 AI 学习技术，Tesla 就使用了基于深度学习的计算机视觉技术。我相信在日本肯定思考过不少这方面的事，比如能够照顾老人的机器人，或者是家庭清扫方向的机器人，它们都会在社会中非常有用，尤其是在一个人口老龄化问题严重的国家。

为什么这种更加以学习为基础的方法会对实际的使用有这么大的帮助？

你只需要去思考「为什么我们还没有这些东西」就好了。为什么我们还没有一个能够清扫家庭的机器人？这就是因为我们每个人的家里都是不同的，比如布置、家具之类的，即使是你自己的房子，它每天的状况甚至都是不同的，有时它很乱、有时又没那么乱。因此，你不可能使用一个预先编程的办法去解决你的家庭清扫问题，对吧？并且，在类似衣物折叠这类问题上，你还会有自己的喜好问题，这就更复杂了。我们觉得这些问题对人类来说没什么难的，但事实上我们所处理的是非常复杂的问题。

这只是一个个人的好奇，你有机器人吸尘器吗？

额…我们没买，但是它真的不是很好用…

因为我买了一个，它并不是「特别」好用，但是我发现我能学习到它的那些怪癖并能与它一起工作，因为我很懒，而它所带来的好处是值得我付出这些的。所以，我很好奇说，当我们拥有了更先进的机器人时，那个「足够好」的引爆点是哪个？我们会在它能达到有意义的人类层面的交互之前就停止前进吗？

我想这是有可能的。我想我们每个人都会去购买价格合理的机器人，因为它能够处理垃圾、帮我们打扫卫生，无论如何，这些非常蠢得机器人确实很受欢迎，而它们也确实没有任何智能的地方。因此，我想我们所进的每一步都会是非常有用的。

那么，你对未来人类、机器人与 AI 之间的互动有什么用的期待？很明显，人们目前都在科幻小说中幻想美丽的场景。

我自己并不会做太多机器人方面的想象，真正令我感兴趣的还是 AI 在科学上的应用以及它的进步和发展。我想要看到 AI 助手在科学上帮助人类处理很多艰苦的工作、检索有趣的文章、在大量数据中发现相关结构、并且协助那些真正能够做出重大突破的人类科学家去工作。几个月之前，我和欧洲粒子物理研究所（CERN）有一场对话，很明显，他们创造出的数据比地球上的任何人都要多，而我们都知道可能有新的粒子就躺在那些海量的硬盘当中，但没人能够分析出它们，因为数据实在是太多了。因此，我想如果有一天 AI 能够参与到发现新粒子的过程中去，那会是非常酷的一件事。

我觉得这是一个非常有戏剧性的结束方式。

文中图片均来自 The Verge

曾经是游戏界大神，现在他想要改变整个 AI 世界

创造新的智能手机助手

改变机器人的世界

最新文章