业内率先实现「AR 变脸」,快手在技术上下了那些功夫?

摘要

快手 AR 变脸爆红的坚实后盾:自研 3D 引擎与 AI 技术平台

近日,相信不少人的社交媒体都被快手的「AR 尬脸舞」刷了屏。这个名为「AR 变脸」的特效,能够将用户的脸部照片绑定在三维模型上,并通过 AR 技术,让这些「囧」态各异的 3D 模型在实拍场景中大跳网红舞蹈。搞笑的动作配合着耳熟能详的背景音乐,喜感与萌感齐飞,让广大用户欲罢不能,大开脑洞肆意「玩坏」自己和亲友。

业界首家实现 AR 变脸

据了解,这也是国内首家实现直接在 AR 模型上进行相册变脸贴合的案例。这样一个轻松搞笑的产品背后,支撑其运转的技术研发却不容小觑,结合了 3D 引擎、AR 算法、深度学习推理引擎等诸多业界最尖端前沿课题。而不同于短视频行业绝大多数企业采用第三方技术供应商,快手的这些技术研发,完全是公司内部团队自身攻克的。

自研 3D 引擎性能强悍

首先,要实现「AR 变脸」产品,需要一个功能强大的 3D 引擎,在其基础上添加编辑器模块、渲染模块、肢体模块、声音模块等,来实现模型精致而自然的光感、材质,并让用户可以自如地拖拽移动模型。据了解,快手拥有自研 3D 引擎,是亚洲业内最早研发该技术的企业,通过技术团队的近两年的打磨,如今 3D 引擎支持多样灵活的玩法,并且能够实现产品快速上线、迭代,今年春节火爆一时的 AR 版「胡巴」,同样也诞生在快手自研的 3D 引擎。而目前在国际上实现了这一技术的科技企业屈指可数,仅 Snapchat、苹果、Google 等支持相关功能。

原创 YCNN 深度推理学习引擎打造核心能力

除了 3D 引擎,要让模型真正在现实世界「扎根落地」,要让 AR 算法实现不断优化,在手机端实现运行,均需深度推理学习引擎的支撑。同时,「变脸」功能也需要对用户的照片进行脸部识别,以精准分割出脸部图像贴到模型上,也需要依赖深度推理学习引擎。相比于很多企业使用开源平台,快手自研了 YCNN 深度推理学习引擎,针对不同手机的硬件架构做了高度的适配和性能的优化,能够使用 CPU、GPU、NPU、DSP 等多种运行模式,根据评测,快手 YCNN 运行速度比已知的引擎高出 50%,达到了亚洲乃至全球业界的顶尖水平,才能保证了用户在拍摄视频的时候能够实时的使用各种魔法表情、AR 等新奇的特效,并且不断开发出更多有趣复杂的玩法。

多媒体处理框架大幅提升技术普适性

快手拥有数亿注册用户,日活超过 1 亿,想让全部用户都能够流畅地体验到「AR 换脸」的乐趣也并非易事。中国网民的终端设备差异极大,其中近 30% 的用户仍在使用双核或单核处理器的低端机型,为手机视频处理适配带来非常大的技术挑战,更不用说实时 AR 效果。为了解决这一问题,快手自研了一个高性能多媒体处理的框架,包括视频处理、音频处理、音视频编解码、2D、3D 动画的能力,能够根据机型动态的选择分别率、码率、帧率尽量发挥设备最大的能力,不论是 iPhone 用户还是安卓用户,都可以拍摄出清晰流畅的视频,体验最佳的特效效果,大幅提升了技术应用的普适性。

一直以来,人们对快手的认知更多停留在「最大的短视频」平台,其实快手更是一家科技尤其是 AI 技术领先的企业,快手创始人兼 CEO 宿华曾表示,「技术驱动」是快手最重要的标签。领先的技术支撑的背后是强大的人才队伍,目前快手员工中工程师团队占 5 成以上,并拥有实力不俗的研发的团队,成员多来自斯坦福、卡内基梅隆、清华、北大等全球知名学府,及 Facebook、谷歌、苹果、微软等国际科技巨头。秉承着「用科技提升每一个人独特的幸福感」的使命,快手正在不断拓展技术边界,为全球用户带来更优质的记录体验。


最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。