全球三强:微软、苹果,和这家中国小公司

摘要

苹果、微软、华捷艾米的新一代 AR 芯片同步量产,席卷全业的巨变即将到来。

苹果、微软、华捷艾米的新一代 AR 芯片同步量产,席卷全业的巨变即将到来。



北京北五环,占地 2.9 平方公里的中关村软件园区内,分布着国内外 600 家高科技公司的总部和研发中心。

2017 年,这片园区贡献了超过 2000 亿的产值,每平方公里的产值高达 805 亿,单位密度产出依旧居全国首位。

智慧和财富在此交汇,行色匆匆的路人,思绪里或许正激荡着改变你我生活方式的新东西。

2 月,我们在这片园区拜访了华捷艾米的团队。本次到访出于一则留言——稍早前,我们的一篇文章里提到了商汤科技、旷视等专攻「计算机视觉」的企业。这两家风头正劲的企业,分别于 2017 年拿下了 4.1 亿美元和 4.6 亿美元的新轮融资;即便放大到整个资本市场,他们的估值体量也位列第二集团,仅次于小米、滴滴、蚂蚁金服、美团等超级独角兽。

文章发布后,有业内人士留言提醒我们:在计算机视觉、乃至 AI+AR 领域,真正有望于芯片做出巨大突破的国内企业,或许并不在文章的名单之中,同时还提到了默默攻关技术的华捷艾米,并「提醒」我们不要「人云亦云」。

华捷艾米是谁?它凭什么被这样认可?获知信息后,我们认真查阅已公开资讯,得到两条比较关键的产业信息:2018 年 6 月左右,3 家企业的手机芯片即将实现量产,分别是微软、苹果和华捷艾米。而在全球范围内,也仅有这 3 家公司具备完整的智能 AR 技术体系(包括人物提取、骨架识别技术和动作跟踪技术等)。

这堪称惊人的信息背后,到底隐藏着一家怎样的至今不广为人知的公司,为了揭开它神秘的面纱,我们赶往了华捷艾米的北京总部,并在那里看到了「AI 的眼睛」。

对于 AI(人工智能),很多人早已审美疲劳。从没有哪项技术像 AI 一样,还未真正面世,便挑起轩然大波。舆论每天都面临 AI 新闻的密集轰炸,但深刻改变生活的 AI 技术从未到来。

从企业到市场,AI 划过了一条泾渭分明的线。

几乎所有大型的科技企业,都在为之展开「军备」竞赛:上游产业链的英伟达,由 GPU 芯片更迭至 AI 芯片后,市值在 2 年内翻了 10 倍;中游的亚马逊,几乎将「深度学习」融入了产品的每个环节,成为 AI 市场的最大赢家;谷歌疯狂烧钱,隔三差五便爆出革命性的 AI 黑科技,但始终停留在新闻阶段;国内,百度正式转型为 AI 公司,阿里和腾讯为之持续并购;BAT 之外,一众初创公司打着 AI 的理念,产品没成熟,便收获了天价估值……

这些企业努力描绘着 AI 震撼人心的应用场景,但民众认知中的 AI 却是另一幅景象:几年来,除了吊打各路英杰的「阿尔法狗」,鲜有其他具象且具影响力的 AI 成果出现。基于这份落差,甚至有人将人工智能称为「人工智障」:吹起来比天大,学啥啥不行。

到底什么是 AI?它什么时候才能改变我们的生活?这个宏观的问题,可以做如下总结:

从发展阶段看来,AI 可简单分为三类:弱 AI、强 AI,以及超 AI。

弱人工智能是擅长某个单方面的 AI,比如阿尔法狗能把柯洁打到崩溃,但你要让它识别动物,它也得崩溃。弱 AI 的范畴相当广,只要涉及归纳、运算,并得到自动化结果的,都属其中。比如百度依托大数据,根据你的兴趣推了条新闻,这就算弱 AI;亚马逊的无人机自动识路送货,算弱 AI;波士顿动力的 Atlas 机器人一个炫酷到爆炸的后空翻,同样只算弱 AI。

目前以及未来一段时间可见的,所有关于人工智能的研发与成果,都只能算是弱 AI。普通民众想象中的人工智能,包括终结者、星球大战等虚构事物,都是强 AI 和超 AI。强 AI 指的是人类级别的人工智能,超 AI 则指在几乎所有领域都比最聪明的人类还聪明,代表 AI 终极形态的人工智能。

即便是弱 AI 领域,成果的差别也堪称巨大,个性推送和无人驾驶显然无法类比,后者涉及的计算机视觉、深度学习以及数据统筹的难度是前者的几何倍数。

一言以蔽之,部分 AI 已经作用于我们的生活,但是效果不明显;而那些效果明显的,比如高智能机器人、无人驾驶等,离我们还很遥远。

现在的 AI 大环境,更像是一个「有机分裂」的整体,不同公司、细分行业,研究的是弱 AI 的某个点,而这些点最终、也必然会结合成为强 AI,彻底颠覆人们的生活。

引用学术界的观点就是:现在的弱人工智能就是地球早期的氨基酸,它们会在某一天突然组合进化成为生命。至于这一天是什么时候,谁也说不准。

在弱 AI「进化」的过程中,有一个经典的认知误区:那些你认为很难的,对于电脑而言巨简单,而那些你认为特「弱智」的,对于电脑而言巨 TM 难。

比如,解一套微积分题,电脑可以秒出结果;但识别放在面前的是一棵小树还是一株大草,对于电脑而言则极端困难;架构一套金融市场的策略模型,对它来说轻而易举;而读懂幼儿的图书、真正理解各种词意——谷歌为此花了几十亿美元,还没做出来。

人类觉得特别容易的事情——视觉、动态、移动,甚至直觉,对于电脑而言难于登天。伸手拿起一件东西,是人类在经过几亿年的进化后,不需要思考便能完成的事情。我们有着全宇宙已知的最复杂的东西——人脑,各处肌肉和关节、以及视觉,在人脑的指挥下瞬间配套完成各种物理工作,这是人类的本能。

这种本能,对于电脑而言恰恰是最难的——现在的电脑连网站的验证码都看不懂,能分辨猫狗的计算机,就能称得上「超级」AI。

看懂、听懂都做不到,怎么能进化成强 AI?因此,弱 AI 的首要难点,便是解决包括计算机视觉在内的各类「基础」问题。

AI 从看、思考到做出反应,是一个非常复杂的工程。业内反复强调的「深度学习」、「增强学习」、「大数据」等,在这个工程里是相辅相成的,真正有价值的研究均离不开其支撑。而在这些之下,最最关键的则是逻辑原理和核心算法。

世界的尽头是物理,物理的尽头是数学,这句话同样适用于 AI。AI 的突破基于逻辑的支撑和算法的突破,在这个基础上,「喂食」数据才有意义。比如,你教会了电脑如何对比、归纳总结一万条狗的特征,它才能识别出狗;反之,它就算看了十万条狗,也是白看。

「科普」结束,主角登场。华捷艾米之所以被称为「全球三强」,根基是它在核心算法的基础上,赋予计算机以立体视觉,进而研发出了拥有全套自主知识产权的 3D-AR 解决方案。

简而言之,它最强的地方,是在大批独角兽公司「钻研」二维视觉的背景下,通过 AI 技术,给了计算机一双类似人眼的「三维眼睛」。

在华捷艾米,我们看到了这些场景:

一位测试员正对着屏幕玩各种体感游戏,从保龄球、乒乓球到跳舞机,不同于微软的 Kinect 之于 Xbox,他是「裸身」游戏,身上没有任何体感设备。唯一的「载体」,是电视机下方一个内置了华捷艾米 AR 芯片的白盒子。

华捷的市场负责人介绍说:「不同于以往的体感游戏,玩家在华捷的体验中需要拿出真实的力量。比如打乒乓球,芯片能读出你的每次速度和加速度,你必须用真实的力度获得足够的势能,才能克服重力,完成击打。」

另一位测试员,则通过 Pad 与一个虚拟形象互动。在他的指挥下,这个「小人」灵巧地翻跃着办公室间的桌椅,遇到墙壁时还不忘绕开。

看上去都是「游戏」,但其所象征的技术以及适用的场景,却远超游戏的范畴。

华捷艾米的创始人及 CEO 李骊,如此简述整个游戏的过程:

在技术层面,上述场景的实现经历这样的过程:

如果你听得云里雾里,那么只需要记住最关键的一点:在全球,能实现这一系统解决方案的仅有三家企业,分别是微软、苹果,以及华捷艾米。

这一结论或许和很多行业新闻大相径庭——在 AI 业内,尤其是国内 AI 界,计算机视觉是最火的细分领域,平均每 10 家公司中,就有五六家有「独到」的视觉技术;而根植计算机视觉的创业型企业里,已经诞生了四五家独角兽级别的企业。

上述的每一家,都有能力做出极端精美的 PPT 和宏大的未来畅想,但 PPT 做得再漂亮,也改变不了一个基础事实:大部分业内企业,都建立在 2D 视觉的基础上。

不同的出发点,造就了不同层次的「眼睛」。「2D 眼睛」的技术更多基于颜色,和相机、手机摄像头异曲同工,它只能捕捉二维信息,对于三维空间的判断容易产生错误,这是该技术的天然缺陷。

一个典型的例子是:作为全球首款搭载 3D 深度摄像头的智能手机,iPhone X 可以实现「支付级别」的人脸识别、设备解锁和面部表情管理。而同一时间,大量鼓吹人脸识别的业内企业,却只能小打小闹,如果真要刷脸付款,他人用一张照片就能搞定。

不论是专攻计算机视觉的各大「独角兽」,还是机场、高铁、安防等领域广泛投入使用的人脸识别,核心都是基于 2D 视觉,国内目前基于立体视觉、推出广泛应用的,有且只有华捷艾米一家。

出于计算机视觉在弱 AI 领域的重要性,作为中国立体视觉的领航者,这家企业的每一步,都是将国内行业往更纵深的方向推进。

「三强」之中,苹果是目前全球 AI 结合 AR 产业的领先者。2017 年 9 月,苹果推出了包括手机、平板电脑、Apple TV 等在内的一系列 AR 产品,并且向供应商下单 1.2 亿套 AR 相关组件。

虽然鲜以 AI 企业自居,但苹果全面 AR 化的背后,包含了大量 AI 技术与知识产权。有统计称,为了拿下这些技术,苹果掏出了接近 200 亿美元的并购资金。结合 AI 技术,苹果在自己的强势领域找到了合适的应用场景,在「落地」上为一众企业指明了方向。

「三强」中的另一家微软,则堪称企业界 AR 乃至 AI 的鼻祖。早在 1992 年,比尔•盖茨就对人工智能做出规划,要「创造能看、能听并且能理解人类的计算机」。以此为指引,微软建立了人工智能研究所,招募了大批语音识别和计算机视觉的顶尖研究者,一「养」就是 20 多年。

很多 AI 实践领域,微软都是先行者。早在 1998 年,他们就展示过数字地图技术,远远早于谷歌;其 3D 体感设备 Kinect,被称为革命性的交互产品……

微软之于 AI,就像美国科技之于全球。他们像灯塔一样探索未知,为后来者提供可见的路径。不过,在成果转化上,微软的 AI 始终不尽如人意,有业内人士称:微软养了 20 年科学家,投入的资金早就以百亿美金计,至今没有收回成本。

在苹果、微软百亿美金级别的投资背景下,华捷艾米的成功显得不可思议:一家创业型的中国企业,如何实现了同样的技术壁垒?

有意思的是,造访华捷艾米期间,正值马斯克引爆全球。他的 SpaceX 成功发射了人类现役运力最强的重型火箭——重型猎鹰。舆论称赞马斯克比 NASA 还强,但实际上,SpaceX 本身就是 NASA 的延伸与进化,其成功离不开美国「国家队」的技术支持。

和 SpaceX 类似,李骊与华捷艾米的背后,同样站着中国「国家队」。

创立华捷之前,李骊曾供职于联想和中兴,期间完成了原始积累。2010 年前后,计算机视觉大热,国内几乎所有上规模的科技和互联网公司都投身其中。浪潮之下,李骊认定这个技术能「改变世界」,于是辞职创业。

不过彼时,他的出发点只是「山寨」一把微软,和「改变世界」没有任何关系。但一圈转下来后,他发现:山寨的可能性完全没有,而此前大举进军的企业们,也正成批撤退。

撤退和无法山寨基于同样的原因:基础学科和逻辑原理的难度太大。

企业经营不同于纯粹的科学研究,新的项目一般周期是 2 到 3 年,如果 2 年没有实质性进展,大概率会被叫停。

对于企业而言,过分执着于基础科学并非好事,财大气粗如微软、谷歌,才能承受「疯狂烧钱」没商业回报的工程;而强如亚马逊,也更多是在应用场景上变出花样。

大企业撤军,李骊和他的「山寨团队」却钻进了牛角尖。思前想后,他们琢磨出了一条明路:找专家教授,而且必须是有深厚专业背景的那种。

创业合伙人中,有一位是 3D 计算机视觉出身,他按照门类,总结划分了 13 个关键的逻辑原理,团队藉此罗列了一张专家学者的表格,拿着名单挨个敲门。

从中科院、清华,到北理工、北航,团队几乎找遍了相关领域所有权威。「那时候中科院还没门禁,我们算是钻了『后门』。」李骊回忆说。

「求学」的过程很顺利,因为「难度很大,教授们一听都很感兴趣」,不仅全力配合,有的还专门给华捷的技术团队开课授业。

虽然团结了大批专业力量,但整体的突破依旧无比艰难。李骊从未想过,光是理顺逻辑原理,就需要数以年计的时间。整整 4 年时间里,他和团队四处奔波,挂靠在各类学校的下属公司里,打一枪换一个地方。

「从没想过要那么多时间,但专家们是越难越想研究,我甚至巴不得他们说做不出来,我好彻底解脱。」李骊说。

千难万阻化为一句话:坚持就是胜利。

在想尽各种办法死撑后,团队最终迎来了曙光:2014 年 8 月,各方专家教授最终理顺了逻辑原理,同一时间,华捷艾米正式成立。

虽然只是个不名一文的初创企业,但李骊隐约感觉到,自己抓住了时代的脉搏。因为出发点就是 3D 计算机视觉,所以华捷艾米的起点比同行都高,干的是只有巨头才能做的事情。

回忆这段峥嵘史,李骊自认是享受了时代背景的成果,因为除了中美,换到世界上任何一个国家,怎么熬,都熬不出这家公司。华捷艾米的「背景」,根基在于中国核心技术的突飞猛进。

成立公司后,李骊在第一时间见了投资人。在清华的一家咖啡馆里,他自带可乐畅谈半天,投资人听完项目,立马拍板了天使轮投资。

天使轮时,华捷艾米的估值是 1.3 亿,1 年后,其估值便暴涨至 12 亿,并被工信部列为 AR 和人工智能核心企业。

虽然身价暴涨,但很长时间内,华捷艾米都是一家隐于水下的公司。掌握基础原理后,他们还有大量算法、数据的问题要克服,除此之外,更关键点在于准确的定位和「变现」方向。

AI 领域,企业的市场应用是出了名的「尴尬」。过去几年,大批 AI 公司尝试了各行各业,「小」到市场零售,「大」到航空航天,AI 概念无处不在,但探索、试点期从未结束。

「雷声大、雨点小」,是造成舆论对于 AI 认知混乱的原因之一,而之所以难「亲民」,归根结底是相关 AI 的技术和服务不能满足行业的需求,客户企业付出的成本高,效果却不尽如人意。

手中的立体计算机视觉如何变现?华捷艾米做了两个定位,其一便是结合 AR 技术,先做强「增强现实」。

AR 和 VR 几乎是同时期火起来的热词,但 VR 已经经历了「疯狂投钱、挨个倒闭」的狂潮,AR 的发展却方兴未艾。

究其原因,这两者虽然听起来像,本质却截然不同。VR 所谓的虚拟现实,本质是显示方式的革新,其入门难度相对较低,因此初创公司如雨后春笋。而 AR 则涉及与真实场景、动态物体的交互,对 AI 相关技术提出了很高的要求。

几年前,业内便有观念认为:在弱 AI 时代,AR 是 AI 技术变现的最好方式之一,它能恰到好处地变革多个行业的用户体验,拥有非常广阔的应用场景。

比如,与电商结合后,消费者可以随意穿试鞋品乃至内衣的大小与款式,电商鞋类居高不下的退换货率将得以迅速降低;

与游戏结合,AR 能创造各式各样的游戏场景与虚拟形象,让真实与虚拟无缝衔接,游戏体验数倍提升;与教育相结合,教师能创造各种适时的场景与物品,比如虚拟的器官将代替真实器官,让学生们随意剖析……

市场负责人介绍称:诸多场景中,华捷艾米的技术已经做到了「无中生有」和「无处不在」,让使用者得以身临其境,虚拟与真实皆触手可及。

和 AI 一样,AR 的应用同样没有主战场,完全在考验业界思想的极限。而所有的这一切,都必须建立在更精确的计算机视觉、更完善的人机交互的基础之上。

如业界所料,相较大 AI 时代的不可预知性,AR+AI 的时代已经迅猛来袭。

2015 年开始,微软发布了 Hololens,谷歌投资 Magic Leap,苹果收购 Metaio,百度发布 Baidu Eye……巨头加速的两年后,业内的第一波大地震正式到来。

今年 6 月,苹果和微软的新一代芯片即将实现量产。业内消息称,继发布全套 AR 产品后,未来,苹果所有的产品都将进入 AR 时代。

为了契合 AR 的需求,2019 年,苹果将推出彻底革新的 iOS 系统,与此同时,微软的 Windows 也将基于 AR 进行全面变革。

全新的起点,为消费类电子行业划出了一条命运的转折口。巨变中的落后者们,不得不展开千方百计的追赶。

去年底,华捷艾米先后接待了一众国际巨头厂商,后者希望将华捷的 IP 纳入自己的体系。

华捷艾米的第二代小型化芯片,第一批产出已经被下游包括手机厂商在内的各类商家索取一空,有消息称,其 AR 芯片,在工艺、性能等方面都足以睥睨苹果的 A11 芯片。

对于一众厂商而言,华捷艾米的芯片就像是雪中送炭。苹果动手后,其他厂商通过自主研发迎头赶上的可能性几乎为零,即便不算技术壁垒,光是从原理研发、数据采集、人工标注,到计算机运算、IC 设计、供应链整合等一套流程走下来,都至少需要 3 年的时间。如此时间落差,落后者早就凉透了。

这样的大背景下,深耕技术的华捷艾米被「强行」抬出了水面。2017 年,他们的合作伙伴突增至数百家,行业遍及 3C、电信、互联网、智能家居、安防等各主流领域。

「眼睛」是 AR 的基础,也是一众弱 AI 变现的关键,无人驾驶、适用性机器人等理念,都极端考验立体视觉。1 年间的爆发,源于华捷艾米的领先技术,也与其定位息息相关。如前所述,方向上,华捷做了两个定位,其一是结合 AR 技术,另一便是基于先行者与领导者的优势,做一家赋能的基础企业。

李骊很清楚,虽然看似和微软、苹果同步,但当下的华捷艾米不可能和对方做同等体量的事情,他们需要的,是和更多强者联手。

他举了一个简单的例子:芯片的 IC 设计和投产是一件大把烧钱的事情,它包含了各种模块,光是购买 USB 的 IP、DDR 的 IP 等资金,都是一笔巨大的投入。华捷艾米的最佳应用场景,是将完全自主的 IP 和 ISK 写入手机等主芯片,以最小的功耗,实现最佳的效果。

立足赋能的定位,华捷艾米的芯片技术得以流向多个领域,比如液晶电视中的面板,智能机器人,以及手机芯片。

经过 9 年漫长的独立研发后,他们将立体视觉、手势体感、人物抠像、AR 技术等完美融合,缔造了当下几乎「无所不能」的芯片。其技术能与各行各业紧密结合,让各大企业加快进入 AI 时代,并且迅速走上「立体」的正途。

不过,饱受追捧的态势下,李骊也动起了「小心思」:华捷艾米脱胎于「国家队」,这轮变局里,他也更希望和民族产业挂钩,互利互裨。在他看来,AR 浪潮是一批中国企业重新定位、弯道超车的好机会,比如展讯等芯片公司,有能力大大缩小与高通的差距,成为中高端手机芯片市场的奇兵。

对于 AR 市场,业内有着趋于一致的预估:到 2020 年,全球 AR 市场规模将达 1200 亿美元,硬件是主要的盈利方式。

而对 AI 产业,因为划分标准、前景预估的差异,各家给出的数据大相径庭:艾瑞咨询估计,2020 年,全球 AI 产业规模约为 180 亿美元;但普华永道认为,到 2030 年,AI 将给全球经济带来 15.7 万亿美元(约 100 万亿人民币)的增长,仅中国经济的总量增值就将突破 7.1 万亿美元(约 47 万亿人民币)。

无论是眼下的 AR 还是未来的 AI,全球行业里只有两个大玩家:中国和美国。在这个被资本裹挟的领域里,中美对于 AI 的投资理念存在明显差别:美国资本更看重技术上的突破创新,中国资本则更关心应用场景和商业回报。这样的对比下,华捷艾米这类公司的出现,显得异常振奋人心。

李骊对华捷艾米抱有十足的信心,按照他的规划,未来凡是需要用到计算机视觉的领域,都可以是华捷艾米的应用范畴——这个领域,几乎包揽了 AI 应用的大半壁江山。而他和团队要做的,就是让这双眼睛更精准、让它背后的大脑更快。

人类的科技进步正以持续加速伴随着爆炸式突破的方式迅猛向前。过去 100 年,人类的科技成果超越此前千万年的总和,有学者预测:21 世纪的 100 年,人类的科技成果将是 20 世纪的 1000 倍。

在这个急速巨变的时代里,一个新技术,很有可能从根本上改变人类的生活方式,而一家小公司,也完全有机会在短时间内成长为巨头企业。

身处其中,即便只是一个见证者,也着实刺激。


最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。