会后空翻的机器人 VS 四仰八叉的斗牛犬，谁才拥有真正的「智能」？

「健全的心灵寓于强健的体魄。」（Mens sana in corpore sano）

在极客公园 Rebuild 2018 科技商业峰会的现场，兼任加州理工学院计算机与数学科学教授和亚马逊 AWS 首席科学家的 Animashree Anandkumar 用这句拉丁谚语表达了她对人工智能行业未来的期待。

Anandkumar 教授所说的「心灵和体魄」，分别指的是人工智能的系统和机器硬件。

举例来说，人工智能系统包括亚马逊搭载在智能音箱平台上的语音助手 Alexa，以及 Google Assistant 等等。而机器的硬件则包括无人车、机器人等等。只有当两者相互匹配时，人工智能才能最大限度地发挥作用，体现真正的「智能」。

畅想中的未来足够乐观，但在达到那个理想目标之前，人工智能行业还有着亟待补足的短板，而攻克这些前沿的技术问题，需要的是另外两样东西的结合：学界和产业界。

而今天的焦点，Animashree Anandkumar 教授本人的职业生涯，就是这两者结合的最佳体现。

走进产业的学界大牛

Anandkumar 教授先后以从康奈尔大学和麻省理工学院以博士和博士后的身份毕业，随后加入加州大学欧文分校任助理教授，在长达数十年的学术生涯里，出身印度学术家庭、极具数学天分的她在学界赢得了无数荣誉，成为了机器学习圈举足轻重的人物。

或许正是因为在学界的突出表现吸引到了亚马逊的注意，2016 年 10 月，她从加州大学欧文分校休假，加入亚马逊担任亚马逊云服务 AWS 的首席科学家（Principle Scientist）。

这一消息在一向与产业界颇有分歧的学界引起了不小的振动，更有趣的是，在 Anandkumar 教授加入亚马逊消息曝出的同时，著名华裔人工智能学者李飞飞也宣布加入 Google Cloud 担任首席科学家，两位学界大牛突然宣布暂时离开学校加入科技公司，这一消息在 2016 年秋天将要结束的时候，点燃了人们对产业界人工智能的希望。

桥接产业和学界的鸿沟

「当我还在学校念书的时候，我从没想过人工智能能够发展得如此之快，那时候我知道人工智能会是一个非常具有挑战性的学科，我知道这会是我终身的事业，正因如此，我才选择了人工智能（作为职业）。」Anandkumar 在 Rebuild 2018 科技商业峰会接受极客公园的专访时说道，「但除了基础研究之外，我还希望这些技术能够真正触达外面的世界，融入人们日常使用的产品之中。」在 AWS，她希望能够实现大规模的机器学习应用，让更多并非精通机器学习技术的人们能够用上机器学习的工具。

在研究理论和使用机器学习技术真正产出产品之间，存在着巨大的鸿沟，学术研究时期，Anandkumar 发现了这点，而加入亚马逊，推动机器学习在 AWS 上的应用，正是她所认为能够缩小这条鸿沟的方法。

提到「缩小鸿沟」，Anandkumar 教授对极客公园表示，她在亚马逊带领团队从事的 AI 研究正是建立在她在学界的相关研究基础上的，「这给我一种在现实世界里做 AI 研究的感觉，」她说道。

加入亚马逊之后，Anandkumar 教授并没有放弃她在学界的研究，相反，她在 2017 年接受了人工智能领域泰斗云集的顶级学府加州理工大学的邀请，成为该校计算机与数学科学的教授。在加州理工，Anandkumar 教授以核心成员的身份参与了一个名为「CAST」的自动化机器人开源项目，「我们用上了很多亚马逊 AWS 的技术，在研究中进行基础的 AI 训练，」她说道，反过来用人工智能加速 AI 的前沿研究，在 Anandkumar 教授看来，这是她桥接两者之间鸿沟的方式，「所以对我而言，两者不会有太多的区别。」

在极客公园 Rebuild 2018 科技商业峰会的现场，Anandkumar 教授发表了题为《「云上的 AI」如何引爆创新突破点？》的主题演讲。在演讲中，学者身份的她聊起了许多时下最为热门的机器学习技术的研究进展，另一方面，作为 AWS「技术布道者」的她也介绍了人工智能目前在亚马逊各条业务线中的应用，以及在她眼里，未来真正智能的机器会有着怎样的模样。

以下是 Animashree Anandkumar 在极客公园 Rebuild 2018 科技商业峰会上的演讲实录（经过极客公园编辑，略有删减）：

感谢大会主办方为我们提供这么多的支持，包括成都市长和副市长也参与了今天的会议，参加了今天的开幕式。我们可以看到成都对于 AI 的发展以及教育非常的重视。今天在这里，我想跟大家简单地介绍一下 AI 人工智能到底是什么，以及我在亚马逊和加州理工学院分别从事的工作，以及未来人工智能的发展方向。

什么是真正的「智能」

我们都知道现在很多科技产品都会使用人工智能 AI 这个词，但到底是什么智能？接下来我想要给大家播放两个小的短片，大家可以看一下其中哪一个更符合「智能」的定义。

可能有一些人不知道，这个是波士顿动力公司的机器人，他在做一个非常复杂的后空翻的动作，我们可以看到做得非常的精彩。这个是智能吗？

让我们再来看另外一个短片，这是人类最好的朋友，一只小狗。这只狗也在试图做一个后空翻，但是并没有成功。

所以大家觉得这两个视频哪一个符合智能的定义？有多少人觉得机器人是更智能的？有多少人觉得狗是更智能的？

实际上，相比于机器人，小狗的行为更符合「智能」的定义。为什么呢？对于智能而言，智能所指的并不是要做一些非常复杂的动作，相反，智能所指的是一种可以用于获取知识和应用技能的能力。我们可以去认知周围的环境和世界，然后会根据世界的变化去动态地调整我们自己的行为。所以说小狗的行为更符合「智能」的定义，因为它们会了解人的一些情绪，然后成为了人最好的朋友。但是我们的机器人完全是靠程序驱动的，哪怕是他做的那个非常复杂的后空翻，但是这个动作本身是由程序控制的。而且这个程序是不可变的，除非我们改变程序，才能让它做到一些其他的事情。所以从「智能」的概念出发，即使它是一个非常复杂的机器人，但它始终不是智能。

当我们在谈论人工智能的时候，我们所指的就是「对数据进行学习」，且「基于这种学习来做出决策」的能力。这是「以任务为导向」的人工智能，它可以做一些比较复杂的任务，比如说它可以识别一些物体或者是图片，但是我们所说的通用人工智能，指的是人类等级的认知以及智能水平。所以有的时候我们对「人工智能」以及「认知导向的智能」这两个概念上会产生一些疑惑，这里我会先厘清这两者。

刚才我们说了什么是人工智能，那么人工智能包括什么？实际上人工智能有三大要素，第一个要素是 AI 的核心，也就是算法。我们需要合适的算法来进行学习以及决策。另外两个也很重要，那就是数据和基础设施。

实际上在 80、90 年代的时候，我们当时就经历过人工智能的风潮，当时大家都非常欣喜地看到人工智能的出现，但是并没有成功推广开来。因为当时我们没有互联网设施，没有足够的数据来训练人工智能的模型。但是现在人工智能的浪潮变得更加的强劲了，而且我们现在有了很多的超级电脑，比过去要强很多。所以说我们的这些基础设施对于人工智能的发展非常的重要。

我们现在在 AI 领域已经有了很多的数据支持，所以开发者如果希望想要把 AI 带到一个新的领域，首先要考虑的就是数据，因为很多时候，如果你想要开发一个 AI 工具，就需要用很多的数据培养它。

亚马逊在用 AI 做什么

刚才提到了我有两份工作，一方面是产业，一方面是学界。一方面我是亚马逊的首席科学家，也是加州理工学院的教授，我也希望可以更好的将学界和产业之间的空缺嫁接起来。亚马逊对于 AI 应用有非常悠久的历史，基本上都会有人工智能的使用，我们有个性化的推荐，大家可以在亚马逊的软件上使用这种个性的推荐，我们也会使用 AI 来进行供应链以及库存的管理。我们会进行一些预测，哪些产品会成功，哪些不会，而这个对于管理我们的供应链是非常重要的。

除此之外，我们也有更多新的计划，比如智能音响（AI 助手），可能很多人家里都有 Echo 音箱了。这种个性化的助手在未来可能会变得非常的流行。现在我们可以给出语音指令，与 AI 助手进行无缝的互动。

最近的一个项目就是 Amazon Go，这是一种跟在商店里「顺手牵羊」差不多的体验，你可以走进 Amazon Go，选取自己想要的商品，然后「直接走」就可以了。这给消费者提供了一种无缝的购物体验，他们不再需要去排队、结账。我们利用计算机视觉技术，使得我们的机器可以知道消费者拿走了哪些商品，这个时候我们就不需要有收银的过程了。

AI 殿堂：加州理工学院

加州理工学院也有着非常悠久的人工智能研究史，可能大家不知道。实际上包括神经引擎在内的一些相关理念，就是加州理工学院最早提出的。而且我们在加州理工学院还有很多非常著名的校友，比如说 John Hopfield 等等，我非常开心能够成为学院的一份子，并且看到人工智能技术和其他的科学领域进行连接与合作，并且看到人工智能技术进一步推进我们在其他各个领域科学的发展。

现在人工智能最为流行的一个应用场景就是计算机视觉，是指可以识别物体的能力。比如说我们的计算机视觉可以识别我们的游泳池以及其他的物体，我们的系统可以自动的，可以进行大规模的图片标记。而且它们可以快速的标记几百万张图片。对于人类，我们可以非常自然而准确地认识图片中的内容，但是对于电脑而言，这是很有挑战性的。因为我们的电脑很难去区分不同的图片，区分不同的物体。比如说我们在讨论游泳池的时候，不一定都是同样的形状。对于我们来判断一个池子到底是不是游泳池，就是判断里面有没有水，能不能游泳。对于人类而言很简单，但是对于计算机视觉和我们的人工智能系统来说，这个过程是很困难的，所以说我们需要几百万个类似的样本，来训练我们的系统，让它们知道游泳池到底是什么样子的。

这样的物品识别的能力和人类是完全不同的，比如说对于人类而言，我们可以进行实时的甚至是无意识中的学习。比如说我们可能没有见过游泳池，但是我们已经知道游泳池到底应该是什么了，但是对于 AI 系统来说不是这样的，所以说我们还有很长的路要走。尤其是我们想要实现人类水平的认知能力的话，我们还有很长的路要走，但是现在我们已经取得了很多的进步。我们可以在很多的应用都可以提供比较准确的 AI 识别。

除了计算机视觉，以及其他的一些特定领域中的应用以外，我们还有卷积深度神经网络。我们知道在 AI 系统提供答案之前，会进行多层的处理，比如说我们的系统可以看到这张小狗的图片，然后通过我们系统的处理，他们会提取相关的特征，从而最终的确定这张图片是一只狗。到底我们会经过哪些不同层级的处理？比如说我们可能在第一级的处理的时候，仅仅会提取出一些基础的特征，比如说一些角度，那么这个时候通过比较简单的角度可以进行比较简单的物体识别。但是可能有一些比较复杂的图形，比如说一只小狗脸，这个时候我们需要更多层级的处理。我们需要把这些比较普通的、基础的特征和更加复杂的特征加以整合，所以说我们才会使用深度学习这个词，因为我们会进行很多层级的处理，而这个也使得现在的卷积深度学习网络和 80 年代是完全不同的。

我们自己的研究希望可以更多的横向拓展我们的机器学习，并不仅仅是深度，还有它的广度。比如说对于图片而言可能有不同的信道、特征、颜色、但是在视频里面，他的纬度可能会更多。比如说我们的一些字符，它可能是更高维度的。那么对于我们的视觉性的问答，它可能维度会更高。所以我们需要把这些不同维度的数据整合到一起来进行处理，因为作为人类的我们是可以看到这些维度、可以理解这些数据的。而且我们知道还有其他的高维度，比如说在量子物理的领域，在爱因斯坦就提出的量子物理学相关理论中，他的维度就是非常高的。比如有作品塑造了一个二维的世界，受到三维世界的入侵。所以说在我的研究当中，为了能够更好的去进行机器的学习，我们就需要使用到张量，这样才能够帮我们分析到更多的维度。通过使用我们的张量，我们就可以更加自然的处理多维度的数据。

这里我们再说回我再亚马逊的工作，对于亚马逊来说预测是非常重要的，比如说我们需要预测亚马逊会出售什么样的产品，市场会有什么样的变化，这是非常重要的问题。但是预测也是非常难的，因为它需要我们的数据有非常高的相关性，而且未来的变化是非常复杂的。我们使用了这种序列模型，我们使用的是张量训练下的序列模型来更好的进行时间预测。比如说在这个图片里面，蓝色的这条线代表的是我们的张量长短模型用于长期预测的一个情况。如果说我们要进行长期预测的话，我们的张量以及我们比较复杂的数学计算，可以帮助我们提升预测的准确度。而且我们需要在机器学习当中，考虑到不同的数学以及物理的变量，这样才能够帮助我们开发出更好的算法。

人工智能的下一步：身体和心灵的结合

我们的未来在哪里，下阶段在哪里，现阶段已经做得非常好了。拉丁语中有一个说法，（Mens sana in corpore sano）是说只有健康的身体才我能有健康的思维。所以我刚才讲的都是关于思维的部分，我们如何才能创建一个具有智能意识的 AI 系统。但 AI 必须进入到我们的物理世界当中，刚才我给大家展示了机器人的一个形象。然而现阶段，我们的意识和机体是分开的，接下来我们的目标是将机体和 AI 意识结合起来。我们启动了这样一个项目，希望能够将 AI 和机器人结合到一起。比如说目前在加州理工学院我们比较感兴趣的是探索机器人，探索机器人可以去探索各个不同的地方，我们也一直在思考如何才能够让这些机器人变成自动的机器人，并走出实验室去探索真实世界。

我们也开启了一个新的项目，也是在全球仅有的一个项目。我们可以将这个机器人在不同的地区进行使用，而且在整个过程当中，我们都可以远程控制他们。这是我们的无人机测试过程，可以看到，我们可以在不同的条件下去测试这些无人机，而且整个测试过程是非常高效的。通过这样测试的方式，我们希望可以有不同的维度，来进行自动化的建设。所以当我们谈到机器人的时候，我们也需要去思考，我们的机器人需要具有什么样的 AI 能力？我们需要不同种类的机器人，第一种叫探索机器人。探索机器人它们可以去探索地球，甚至说以后可以探索太阳系当中的其他行星。第一种探索型需要将它进行设计，让它可以在卫星上面工作。希望我们的这些探索型机器人能够去到新的环境，代替人类进行探索，这就是我们 AI 的第一个应用，我们把它叫做直觉型的机器人。即使它们放在一个全新的环境当中，这些机器人也可以特别快的去学习到周围的环境。

人类是这样，那我们机器人是不是也能这样呢？其次我们还可以用机器人来做交通工具，在亚马逊一直都需要各式各样的交通工具，让机器人能够进行导航，完成我们人类要求的任务，比如说驾驶汽车。此外还有一种类型的机器人，我们把它叫做是保护机器人。保护机器人所做的工作是拯救人类，当自然灾害发生时，比如说地震或者是火灾的情况下，它们可以迅速的拯救人类，也需要有该地区的地图，这一点叫做协商型的人工智能。此外，我们还有另一种类型叫变形机器人，通过变形机器人，你在想象它的时候，可以想象出一个人需要去转移一个货品，但是地形非常的复杂。那这个时候我们需要的就是要这些变形机器人。到底它现在处于什么位置？在做什么？需要的是一个协作。所以我们在做变形机器人的时候，不仅仅需要它能够完成任务，也需要它能够迅速的适应环境，这是我们面临的一个挑战。

另一种类型叫做生活伴侣，我觉得这对于我们现有的机器人，在智能方面是最具挑战性的。因为生活伴侣必须试着去了解我们的需求，然后再根据我们的需求，做出相应的反应。在今后，我们会有更加高级的生活伴侣，它会了解我们人类的需求，成为我们的朋友。这对于我来说就是最后的一个阶段了。