特写 | 解密阿里云 ET:在人工智能领域,「阿里巴巴在业务上是全球第一」

摘要

在谈论「人工智能」的时候,我们不应该忘记阿里巴巴

当时钟刚刚驶入 2016 年 4 月 9 日的时候,《我是歌手》第四季总决赛在湖南卫视落下帷幕,赛前被广泛看好的 CoCo 李玟夺得了总冠军。但当天,我们在记住了李玟的歌声以外,还被另一个意外出现的事件所吸引,那就是阿里云小 Ai。

赛前,高晓松等人就放出了有关阿里云小 Ai 的预热,称其有很大几率预测到最后的冠军。即使「黑幕说」不可避免,但这个点还是成为了当天晚上除比赛之外的一个关键词。

「其实这个事当时是一个偶然,当时大家都觉得挑战非常大。第一,电视直播你错了就错,出丑就大了;第二,这个事情本身是非常难的,因为像音乐鉴赏这个事儿本身就没有客观标准,是非常主观的行为,没有标尺可选」,这个项目的负责人闵万里说道。

事实似乎也证明了他的说法,在赛前,它给出的预测结果宣称韩国歌手黄致列将会夺冠,这与最后的结果并不相符。不过还好,随着比赛的激烈进行,各种数据和信息都在发生着变化,在第一轮淘汰之后的几次预测中,阿里云小 Ai 都表现出了比较精准的结果,并且在最终的三选一中成功预测到了李玟的夺冠。

ET.jpg

在赛前的发布会上,闵万里表示,小 Ai 是阿里云研发的人工智能程序,主要基于神经网络、社会计算(social computing)、情绪感知等原理工作。

做别人不想做、不敢做的事

闵万里现在是阿里云大数据孵化器团队的负责人。在《我是歌手》节目之后,他又带着阿里云小 Ai 的升级版——阿里云 ET——在双十一晚会上协助马云变了一场魔术。

在闵万里看来,通过在这种电视节目上的亮相,老百姓能真正感受到什么是「人工智能」。

image (1).jpg

                                         (双十一晚会变魔术)

不过,事实上,人工智能上电视早已不是一件新鲜事了。早在 6 年以前,由 IBM 公司开发的人工智能程序 Watson 就在美国当红的电视问答节目《危险边缘》(Jeopardy!)中战胜了人类冠军,一举成名。而 6 年之后,以「人工智能」为核心战略的百度和搜狗又在重复着相似的工作。

即使面对着记者,闵万里在谈及竞争对手时也几乎没有讳言。这位本身就出自 IBM 公司的科学家表示对百度和搜狗的比赛结果「无所谓」,因为「它哪怕全胜,他也是在重复 Watson 的故事」

而他要做的是「从零到一的事情」,「我要证明的是别人没有做过的,或者别人不想做、不敢做的事。」

微信图片_20170401151824.jpg

                          (阿里云大数据孵化器团队的负责人闵万里)

闵万里的团队目前的主要工作是在云上面做一些大数据的应用解决方案,并孵化一些创新的案例。预测《我是歌手》的冠军当然很吸睛,不过只是一次小的尝试,投入更大、意义更大、受重视程度更高的项目还要属目前在杭州试水的「城市大脑」项目。

去年 9 月,「杭州城市大脑」的交通模块已经在萧山区市心路投入使用,试验数据显示:通过智能调节红绿灯,道路车辆通行速度平均提升了 3% 至 5%,在部分路段有 11% 的提升。

据杭州政府透露,阿里云 ET 人工智能技术将为城市大脑提供内核支持,采用飞天操作系统,将百万级的服务器连成一台超级计算机,可对整个城市进行全局实时分析,自动调配公共资源。

微信图片_20170401151931.jpg

                      (杭州城市大脑项目正式发布的现场)

事实上,在过去的 10 年中,所谓的「智慧城市」概念已经被大大小小的企业炒作过很多次了,但却没有哪座城市真正体验到了「智慧」的感觉。在闵万里看来,其原因就在于「单兵种太多,各个家都有机房,都有数据中心、信息中心,但这些东西最后都没有打通」。而解决问题的关键就需要有一个信息贯穿的大脑。

而由于自己之前有过很多相关的成功经验,比如在广州市通过互联网数据调控交通灯,阿里觉得自己可以做这件事。

当然,给他们这种信心的不仅仅是过往的经验,还有背后强大的技术支撑。其中计算机视觉部分「城市之眼」就提供了很大的作用,负责这个团队的则是图像领域的专家华先胜。通过对各种图像及视频数据进行深入分析,他们能帮助整座城市做进一步的决策。

「从场景当中长出来的」

闵万里和华先胜的经历颇有些相似的地方。

2013 年 9 月,当时还在硅谷的闵万里回到了杭州,加入了阿里巴巴集团。在此之前,他先后在 IBM Watson 研究所和 Google 从事人工智能方面的研究工作。

而华先胜则稍晚一步。2015 年年初,因为阿里的邀请,华先胜从西雅图回到了国内,加入了阿里巴巴。此前,他已经在微软工作了 14 年。目前他则是阿里云视觉计算团队的负责人。

阿里云11111.png

                          (阿里云视觉计算团队的负责人华先胜)

事实上,大概从 2013 年开始,阿里巴巴陆续从世界各大顶尖团队挖来了多位世界级人工智能专家,美国密歇根州立大学终身教授金榕,麻省理工学院博士、普渡大学终身教授漆远都是在那段时间从美归来,加入了阿里。

那时,「人工智能」作为一个学术名词还停留在很多学术机构和大公司的实验室中,工业界还远未像今天这般重视这个技术领域。在国内,百度毫无疑问是最早的布局者。2013 年年初,百度就成立了百度深度学习研究院(Institute of Deep Learning,IDL),并在三个月之后在硅谷成立了硅谷人工智能实验室。

虽然没有百度那样早的战略布局,但阿里也已经在一些专业领域——比如电商部门——开始了人工智能方面的研究。闵万里刚刚加入阿里的时候就是在电商部门做数据挖掘的相关工作,而华先胜则负责淘宝「拍立淘」的开发任务。

0ab9c176e7cc3fe49bcd741c066033a9ad6bb44c.jpeg

                                      (手机淘宝中的拍立淘)

早他们二者一步进入阿里的初敏对这个过程有着更完整的了解,在这位在 2009 年就追随王坚博士的脚步进入阿里的智能语音技术专家看来,阿里作为一家以电商立足的公司,「接地气」就是他们做人工智能最大的特点。在这里,「接地气」的意思就是「从下面的基础业务部门开始推动」。

「一开始是业务部门感受到了这个趋势,然后小的业务部门就开始说我需要这个技术。可能最开始是从外面采购,后来才慢慢发现这个不对,这么重要的技术是应该我们自己要做的,然后就开始自己做。」

闵万里则用「从场景当中长出来的」来总结阿里巴巴人工智能技术的发展史,此言不虚。而他也认为这可能也是阿里巴巴和其他公司的主要区别之一。

从一个个独立场景到阿里云

「我能想象到最好的使用场景(图片搜索)就是电商。我认为拍照购物这个场景是很有道理的,因为我经常看到一些东西,可能我不好描述。比如我很喜欢你这个背心,那我怎么描述它,这个不好描述,但是我拍张照片就好了。」

因为自己的这个理念,华先胜离开了微软来到了全世界最大的电商平台阿里巴巴,并且在一开始并没有加入阿里云团队,而是进入了电商团队的搜索事业部。在那里,他主要负责的项目就是淘宝 App 中的「拍立淘」功能。

「拍立淘」可以让用户通过拍照的方式实现「以图搜图」,以此来解决用户在不知道商品名称的情况下购买的问题。在此之前,淘宝其实已经有这个产品了,但是离用户的期望还差得很远。其中如何处理淘宝卖家们千奇百怪的图片就是一道难题,「你知道有的卖家的商品图片都是像牛皮癣一样,上来贴满了狗皮膏药。」

而华先胜通过一年多的工作让这项功能有了很大的提高,他把每张图片变成几千个数字,用这几千个数字代表某件商品的特点,比如一件衬衣是长袖还是短袖,什么样的领子,有哪几个颜色。「这几千个数字就要把它描述出来,虽然人眼看不出来。但是这几千个数字就反映了它的本质特征,这都是人工智能的技术在里面。」到了 2015 年双十一当日,拍立淘的使用量超过千万。

但这时,云计算的大潮已经兴起,阿里也早早将其当作了自己的又一个核心发展方向。于是,因为公司的需要,华先胜离开了电商部门,加入了阿里云。

初敏的经历也证明了这不是一个个例。这位语音专家在加入阿里的前几年做过各种和数据有关的事,其中包括了翻译、输入法、淘宝搜索、阿里搜索等等,「最终回到这个行业是 2014 年下半年了。」

微信图片_20170401152718.png

                       (阿里云 iDST 技术总监、阿里云语音团队负责人初敏)

从 2014 年下半年开始,阿里开始在阿里云的体系下进行人工智能方面的综合性研究。

考虑到人工智能所需的两大方面:强大的计算能力以及广泛的应用场景。这个战略决定从技术的角度来看似乎再合理不过了。

  • 首先,人工智能的基础就是算法和数据,如果没有足够强大的计算能力,计算机没有办法变聪明,而这恰恰是阿里云的长处。从 2008 年开始,阿里云在王坚博士的带领下开发了强大的飞天系统,这套系统目前有 100 万个 CPU 的核,有 60 万块硬盘,相当于一个 EB 的存储能力。
  • 第二点,作为属于未来的底层基本技术,人工智能的应用场景一定不仅限于电商领域,而这就需要阿里云发挥作用了。「因为阿里云服务的就是外面很多行业,所以从这点来讲,你看到行业的诉求和痛点的时候,你就有可能绽放出一个好的解决方案,把人工智能技术用起来,发现了成功案例就去宣传。

目前,阿里云在自己的平台上开放了多个相关的 API,比如人脸识别、智能语音交互等等。外部的创业公司可以通过使用阿里云的服务免去自己开发的相关步骤,而他们在使用过程中产生的数据经过回流还可以让阿里云 ET 变得更聪明,「这其实是个双赢的事情。」

ET1.PNG

                                   (阿里云官网上发布的部分 API 服务)

将人工智能与「云」结合起来的战略还体现在云 OS 操作系统上。目前,据初敏透露,阿里云智能语音团队很大的一块工作就是跟云 OS 进行深度合作,因为「云 OS 的操作系统是支持多端的,这里面云能力也是需要多端的,而且应该是多端打通的」。

不过,在采访中,阿里云的相关工作人员也表示「人工智能」在阿里内部的地位未来还会再提高。虽然截至本文发表当天还没有确切的相关消息,但就在不久之前的阿里巴巴集团首届技术大会上,马云宣布将建立阿里巴巴的『NASA』,「面向机器学习、芯片、IoT、操作系统、生物识别这些核心技术组建崭新的团队,建立新的机制和方法。」

但无论未来人工智能被阿里提到哪一个层级,阿里云都会是其中重要的一环。

要做平台

「苹果会说自己在人工智能行业是『second to none』,你们会怎么评价自己?」

「其实从技术上来讲,各家都有特色,或者说侧重点不一样。但是从人工智能在业务领域、垂直行业的创新上来说,我觉得阿里巴巴现在应该走在全球的最前面。」闵万里说道。

因为自己带领的既是一个技术团队,同时还是一个业务落地的团队,所以闵万里需要承担商业方面的 KPI 指标,但这也让他和阿里云人工智能的落地情况有了更深的了解。他同时认为,阿里和其他公司在人工智能方面的最大差别就是「对技术和业务场景的深刻理解和抽象提炼」,但这并不表示阿里需要把所有的场景都自己做掉。

「我们要在某些垂直行业当中找到 1 到 2 个创新的案例,我们要证明这些能力加上正确的方法,能够在这个行业产生价值,后面才会有更多的公司愿意跟着我们一起在这个行业当中深挖,把另外的一些痛点给解了,这样我们就把这个生态给做起来了。」

承接各个场景,这种对业务领域的广泛布局成为了阿里的优势,也自然而然变成了他们未来的长远目标。

TB1uyXuQpXXXXaJaXXXXXXXXXXX-795-413.png

「建立云上视觉计算的生态」——这是华先胜心目中的长远目标。在他看来,广义的 AI 也可以平台化、生态化,这样「大家都可以在 AI 的平台上去做研发、部署和生产」。

这听起来很符合阿里的气质和地位。在和几位高级研究人员的对话中,他们都或多或少表露了类似的意见和想法。闵万里也认为,将来的趋势一定是一个「多链路、多种功能的结合」,一定是「多种技术结合成一个完整的解决方案去解客户的问题」。

因此,「那些有特色的小而美的公司会成为这个生态当中非常重要的补充,或者是应该成为这个平台上的一个很好的玩家。」

「我们会去做底层的平台性的东西,然后他们在上面做各个方向的垂直。所以这些人我们认为都是我们的生态伙伴」,初敏也这样认为。

最后,要找到技术的正确传递方式

一切的问题似乎都变成了「寻找正确的产品形态」。

当我们坐在阿里云的办公室里时,初敏为我们展示了支付宝中的语音入口,「帮我给 XX 转 20 块钱」,屏幕上出现了通讯录中的那位联系人的名字,确认之后,不用点击,20 块钱就转了过去。

这个过程看上去还不错,而淘宝和天猫这些阿里系的 App 中的语音入口也大同小异。初敏把这种交互方式称为「意图的分发」,目的就是在复杂的多层任务中直接传达意图,只是「产品形态还没有跟上」

微信图片_20170401153129.png

                   (支付宝中的语音助手功能)

当然,谁也不知道最终的产品形态会是怎样。仅拿语音来说,初敏认为 Amazon Echo 的例子很成功,但不一定是最后的答案,「我是认为只要有一个总的入口就好了,这个东西来控制所有其他的东西」,初敏说道,「这个东西也许是手机,也许是家里的音箱,或者也许就是你那个 Wi-Fi,因为每家都有一个 Wi-Fi 入口,也可能是你厨房里那个冰箱,具体是什么我觉得不好说。」

而华先胜则认为算法数据用户平台商业模式这 5 个要素是他心目中一个成功的人工智能商业应用的必备要素。

在他看来,顶尖团队在算法上的差别会越来越小,大家比拼的是综合的资源,你既要有算法和数据,还需要训练数据的能力,并且还需要通过正确的商业模式触达到足够多的用户,以此才能真正成为一个成功的人工智能商业应用。

闵万里也觉得这是一个相辅相成的事情,你既要有技术,还需要对业务场景有足够的了解。「应该这样讲,我们的人工智能技术不是为了技术而技术,我们一定是一个全站式的解决方案,我们的技术上来之后就能解决客户问题。」

在刚刚结束的阿里云栖大会·深圳峰会上,阿里云在人工智能领域发布了 ET 医疗大脑及 ET 工业大脑这两个新的垂直类项目,一个专注于医疗领域,另一个则负责工业生产方向。这似乎是阿里云 ET 沿着这些思路所做的新尝试。

微信图片_20170330132838.jpg

                                (最新发布的 ET 医疗大脑)

「我们将 ET 医疗大脑设置为一个开放的人工智能系统。除了阿里云的人工智能科学家投入到研发当中,我们更希望能吸收外部精良的算法与医学经验,这样 ET 才能更快地成长为一名高级医师。」闵万里说。

结语

2016 年 8 月 9 日,在阿里云云栖大会·北京峰会上,阿里云总裁胡晓明说:「也许在 20 年后,管理阿里巴巴的,将是一位商业领袖 ET!」

「这样的场景真会出现吗?我们又该怎么样定义阿里?它会是一家云计算公司,还是电商公司,还是人工智能公司?」我把这个问题抛给了闵万里。

我觉得可能到后面,云计算和电商都不需要再谈了,因为它已经深入人心,无处不在了。但是『人工智能』这个词会热很久,热很久有好有坏,一方面它还一直不断地在完善当中,另外一方面它能够持续保持关注度,成为社会大家的一个共识,就像今天我们讲互联网,没有人去挑战。所以说,那个愿景我觉得是有可能实现的,但是不是百分之百靠 ET 就是另外一回事了,」保持着他一贯的微笑,闵万里回答道。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。