在 OPPO 和 vivo 漂亮的翻身仗背后,是 AI 视觉应用的新风口

摘要

在人工智能与 3D 技术的交叉口,创办七年的旷视看到了属于它的新机会。

「风口已经来了,」旷视科技高级副总裁吴文昊在接受采访时说道。

2017 年,走出人工智能创业战场的混乱,龙头创企旷视借着智能手机向 3D 跃迁的东风,拿下了一片属于自己的落地市场——「3D+AI」。

今年上半年全球智能手机市场的光环是属于 OPPO 和 vivo 的。这两家曾经因为模仿苹果设计而为人诟病的国产手机厂商,在今年分别推出了自己「无刘海的」全面屏解决方案,无论是在普通消费者还是行业里都赢得了一片叫好声。

但大多数人不了解的是,两家公司都使用了同一家公司的人脸识别解决方案——旷视科技的 FaceID。在安卓手机随 iPhone 一起搭载人脸识别的浪潮中,旷视不声不响地拿下了行业 70% 市场,成为了那个帮助 OPPO 和 vivo 完成「激进」创新的「隐形英雄」。


行业缺一个整合者

据 IDC 方面的数据,苹果 iPhone X 发布之后,2017 年全球应用 3D 技术的手机终端已超过 7000 万台,预测今年随着安卓市场跟进,以及 3D 技术在苹果更多品类的产品上应用之后,这个数字将达到 3.5 亿台。

2017 年,就在苹果发布 iPhone X 之前,国内一家首批为人脸识别立项的手机厂商组织了包括旷视在内的十多家的供应链公司一起,讨论如何能够做出一个垂直的产品化解决方案,包括传感器、模组、芯片等行业在内的十多家遍布全球的产业上下游供应商都有参与。

在这次的讨论中,旷视发现了行业里存在的问题。「最大的问题是,这是个很新的东西,每家做的都是其中的一个组成部分,它们其实缺乏一个主心骨,大家互相之间比较分散。做硬件的不懂软件,做软件的对硬件的了解、把控也有不足。」吴文昊说道,「我们越来越认识到,真正的落地一定是应用驱动的。」而旷视,恰好适合做行业里提供整合方案的那一环。

旷视科技高级副总裁吴文昊

苹果在将 3D 技术应用于智能终端上时,「前前后后花了十几亿美金」,收购了十几家相关算法、硬件的公司,在 iPhone X 3D 结构光的应用里,苹果是那个产业的整合者。现在,在安卓的世界里,旷视想做的也是一样的角色,把软件、硬件、算法、应用统统整合起来,「当这个整合者出现时,整个 3D 落地才会大大加速。」


解决方案到来

2018 年 8 月 8 日,旷视科技在北京总部举办了一场「3D 视觉产业先锋研讨会」,组织起四家产业里的合作伙伴,共同探讨「AI+3D」技术在未来数字化世界中的应用及发展。在研讨会上,旷视基于自身在行业内的观察和实践积累,于业界首次发布「软硬一体」的移动端 3D 感知全栈解决方案,从算法创新、应用开发、设备制造到解决方案打造四个层面,阐释其「AI+3D」的发展脉络。

活动上,旷视科技高级副总裁吴文昊介绍称:「手机 3D 视觉领域虽然已有多种类型的应用案例出来,但该领域包含算法和模组的软硬一体整体解决方案仍是缺位的,旷视科技正在尝试一种从上往下的整合方案。」在旷视发布的软硬一体移动端智能 3D 产品解决方案中,最上面一层是 3D 应用层,往下依次至 AI 算法、解决方案,最后到摄像、传感等硬件设备制造上。

应用方面,在手机 3D 视觉能力的开发上,旷视研发的 3D 人脸识别解锁和 3D 人像光效应用已经实现了大规模的应用,并且还在业内开发出全面可用的安全支付、3D 美颜、3D 整形等应用。下一步,旷视将投入到 AR 游戏、虚拟试穿等应用上,持续探寻 3D 能为手机带来的更多能力。

算法方面,旷视专注于识别和重建两个大类。识别即机器感知、理解世界的能力,也是旷视的强项所在,基于旷视自研的 MegBrain 深度学习引擎,旷视在人脸识别、人体识别、活体检测、注意力检测追踪及其他图像识别的算法层面拥有业界顶尖的技术实力。重建即把识别出的物体进行三维重建,是开发针对人、针对物的 3D 视觉应用核心所在,旷视目前已在人像 3D 建模、人体 3D 建模及物体几何测量算法研发方面走在世界前列,并与 Bellus 3D、Altizure 等 3D 视觉企业开展了联合研发合作。

解决方案上,不同的应用场景需要不同的 3D 视觉解决方案,旷视根据不同应用场景中对深度计算、深度修复、深度优化、标定、畸变校正等能力的需求,设计出基于双摄、三摄、深摄的丰富解决方案,在整合结构光、TOF、双目等不同的摄像、传感系统架构上拥有成熟的应用经验。

硬件模组方面,移动端 3D 产业链最下面一层是硬件制造,包含摄像头、传感器、芯片等硬件模组的研发。结构光、TOF 和双目方案涉及到高清摄像头、IR 投射器、IR 接收器、激光发光器等设备的搭配组合,旷视目前已经与艾迈斯半导体等 3D 硬件模组厂商展开合作,在业界率先建立起软硬一体的 3D 视觉技术优势。此外,还将联合主要芯片厂商合作研发算法适配性更强的芯片,进一步优化手机 3D 应用能力。


不止手机

手机是旷视 3D 技术应用落地的主要场景之一,目前,旷视已与包括华为、小米、OPPO、vivo 在内的十多家国内领先的安卓手机厂商达成合作,其人脸解锁、人脸支付、美颜、人像光效以及 AR/VR 等应用都在智能手机上找到了直接的落地场景,其中 OPPO Find X 对其 3D 结构光的应用以及 vivo 使用的 3D TOF 应用都已经取得了市场和消费群体的认可。

手机以外,旷视认为「3D+AI」的技术还有着更多的可能。研讨会现场,旷视请来了四家手机行业以外的合作伙伴。

移动端 3D 面部扫描技术公司 Bellus 3D 的创始人 Eric Chen 曾是苹果 Quicktime VR 项目的创建者之一,有着 30 年的 3D 行业工作经验。2015 年,他创建 Bellus3D 专注于为手机等移动设备提供高解析度的 3D 人脸扫描、建模技术和产品。Eric Chen 认为,当前 3D 产业的技术和硬件研发进入快速发展期,研发 3D 扫描器不再像以前一样昂贵、难做,3D 应用或许现在还不能完整清晰的面貌,但未来人手一台三维扫描器后每个人都将成为应用的开发者,创造无限可能。

Bellus 3D 创始人 Eric Chen

Altizure 是一家三维重建技术应用系统集成商和网络解决方案提供商,其开发并运营了全球独一无二的无人机三维重建社交平台 Altizure,目前该平台已拥有来自全球各地成千上万个 3D 重建模型。其联合创始人兼 CEO 方天在会上表示:「自 2015 年上线以来,Altizure 已经和众多大型工程企业合作为其提供项目工程的三维建模服务,帮助提高建筑效率和质量。」

Altizure 联合创始人兼 CEO 方天

另一家参会公司叠境数字科技公司的产品会更吸引人一些,它使用的是与颇受争议的创业公司 Magic Leap 同样的光场技术。叠境研发了一整套光场重建系统来实现更加逼真的 3D 建模。「光场技术相比于其他三维建模技术来讲比较新颖,但却在动态建模和建模逼真度上拥有显著优势,光场技术在 VR、AR 领域具有巨大的应用价值,叠境目前已经通过自主研发的结合人工智能技术的光场系统,在构建更加真实的 VR 场景和 AR 效果上取得众多成果。」其叠境数字科技联合创始人兼 CEO 洪煦在会上说道。

叠境数字科技联合创始人兼CEO洪煦

除了 3D 技术的应用企业之外,到场的还有一家供应链上游的半导体公司艾迈斯(AMS)。在高性能传感器解决方案领域成绩颇丰的艾迈斯在过去一年中营收有 70% 的增长来源于手机市场,其中 3D 摄像模组的贡献尤为突出。大中华区销售和市场副总裁陈平路表示:「(艾迈斯半导体)与旷视这样的人工智能企业合作,能够不断加强自身传感设备在人工智能和 3D 多个领域的领先性,为中国更多手机厂商提供更优质的硬件制造服务。」

艾迈斯半导体大中华区销售和市场副总裁陈平路


「风口已来」

在活动结束后的采访中,吴文昊对「计算机视觉的下一步是 3D 视觉」的观点表示了肯定。

吴文昊认为,今天硬件的飞速发展让 3D 技术的基础,计算能力和可用性发生了天翻地覆的变化,「今天已经有了 7000 万台拥有 3D 能力的手机,明年就是 2 亿到 3 亿,它能够产生的应用场景已经完全不同了,」他说道,「这个风口真的已经来到了。」

看准了这个风口的旷视决定在 3D 上付出更多的投入。「手机上的摄像头肯定是越来越多的,」吴文昊说道,主攻视觉的旷视看准的就是摄像头数量的激增带来的机会,「摄像头的个数可以帮我们简单判断市场的容积和我们在这里真正能够产生的价值」。

在人工智能与 3D 技术的结合上,创办七年经历了多轮融资的旷视看到了属于它的新机会。从一个风口走出,沉淀了技术,积累了经验的旷视迈向又一个细分的战场,开始了它的下一场征程。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。