2019世界人工智能大会|视觉AI回归理性,腾讯优图加速产业数字化升级

摘要

优图已拥有超过 700 项专利技术,并形成了专利产出的完整链条。

8 月 29 日至 31 日,2019 世界人工智能大会在上海举办,在 31 日举行的「科技有道 择善而行」——腾讯论坛上,腾讯优图实验室总经理吴运声带来「视觉 AI·加速未来」主题演讲,从技术研究、应用落地、社会价值三个方面带来阐释,吴运声指出,在人工智能热度不断提升的今天,视觉 AI 回归理性,真正有技术含量和产业应用价值的研究得以沉淀,将实现视觉 AI 研究和落地双加速。

作为腾讯旗下顶级人工智能实验室之一,优图以计算机视觉技术为核心,专注人脸、人体、交通、医疗影像、自动驾驶等视觉领域的前沿研究和产品落地,为各行各业提供了超过 15 个行业解决方案,接入了超过 90 项腾讯明星产品业务合作。如今,腾讯优图在技术研究和产业落地「两条腿」支撑下,通过产业应用实践对技术进行检验,不断加速产业数字化升级,同时探索如何让 AI 真正惠及社会大众,为「科技向善」加速。


视觉 AI 研究加速,技术突破带来无界想象

近年来,优图持续深耕视觉 AI 前沿技术研究,技术研究不断加速,从开源算法、论文发表,到专利和前沿技术研发,始终保持着创新与活力。

据吴运声介绍,依托与学术界、政府、企业等联动,腾讯优图不断整合优质科研资源,搭建了产学研用相结合的人才矩阵,推动计算机视觉技术的发展。在计算机视觉领域级别最高的研究会议 CVPR 上,仅 2019 年就有 25 篇论文被收录;此外,优图已拥有超过 700 项专利技术,并形成了专利产出的完整链条。

在前沿技术领域,吴运声重点介绍了优图在步态识别上的阶段性成果。「相比于已经被人们广泛知晓的人脸识别技术,步态识别通过捕捉人类行走模式进行身份识别,即使是在换装、换场景、面部遮挡等情境下也可以准确识别,在刑侦安防、医疗康复等领域具备很强的应用性。」在研究中,优图创新性的提出了 OGFN(Ordered Gait Fusion Network)算法,可实现步态识别精度的提升。近日,该算法刷新了步态识别领域两大核心数据集 CASIA-B 数据集和 OU-ISIR MVLP 成绩,部分情景识别准确度提升 11.3%。此外,针对因为拍摄距离较远导致图像分辨率低的场景,优图步态识别借鉴了此前行人重识别研发中的成果,为准确识别提供了强大的特征依据。

另一项重要成果是腾讯优图联合英特尔正式宣布为 AI 爱好者推出了基于 Movidius MyriadX 芯片的 AI 视觉模组 VisionSeed,内置世界领先的优图人脸识别算法,接入即可实现人脸检测、属性分析、姿态估计、人脸识别等功能,大大降低了 AI 产品开发门槛,让普通开发者也可以探索其功能,DIY 各种智能产品。通过不断开放软硬件技术能力,惠及更多的 AI 爱好者们。对此,吴运声表示:「我们希望通过 VisionSeed,将优图的 AI 技术能力进一步开放出来,帮助更多的 AI 开发者『零基础』快速获取 AI 能力,完成 AI 创新产品的研发。」


视觉 AI 落地加速,助力产业数字化升级

得益于中国得天独厚的落地场景和政策的扶持引导,中国人工智能在产业落地上亦不断加速。依托前沿技术研究,腾讯优图视觉 AI 走出实验室,加速产业数字化升级。吴运声以优图在智慧生活、医疗、社区等领域的落地为例进行阐释。

在智慧生活方面,视觉 AI 正在落地生活场景,为民众生活提供切实的便利。在腾讯与步步高合作的智慧门店中,刷脸识别会员、刷脸支付均依托于优图人脸识别技术。吴运声介绍道:「消费者在 2 秒内即可完成支付,门店收银效率提升了两倍,为步步高节省 30% 以上的人力成本。」

而在智慧社区领域,行业应用正从单一的安全领域向多元化行业应用方向发展。优图赋能腾讯海纳,推出「服务+安防」的解决方案。「我们的方案主要包含社区服务和社区安防两套场景应用,前者以居民为中心,打造居民生活服务平台;后者则是以物业为中心,打造图像大数据系统,让生活更安心。」据吴运声介绍,海纳业务中台作为智能业务决策中枢,将 AI 计算、硬件物联等多维技术与业务数据紧密融合,联动社区服务和安防,实现有温度的科技感智慧社区。

医疗领域,针对优质医疗资源稀缺、地区发展不平衡等普遍难点,优图通过腾讯觅影持续对外输出医疗 AI 能力,已支持宫颈癌、肺癌、眼科疾病等多种疾病筛查,在全国 100 多家顶尖三甲医院落地。吴运声指出,「AI 将作为助手,辅助医生,提高临床医生的诊断准确率和效率,并助力推进医学 AI 向基层的下沉。」

从人工智能在零售、医疗等产业的快速落地中不难看出,AI 与产业融合的趋势愈发明显。未来,AI 将成为各行各业降本提效的关键武器,助力行业升级转型。


科技有道·择善而行,视觉 AI 加速「科技向善」

科技有道,择善而行。前沿技术不仅为产业升级提供关键助力,也在更广泛的社会生活中发挥着社会价值。在视觉 AI 加速未来的今天,优图秉持着「科技向善」的理念,将 AI 作为一种工具,为「善」加速。吴运声重点介绍了优图的两个公益项目——AI 寻人和 AI 手语翻译。

由于我国地域广、人口基数大,警方仅凭幼时的模糊照片去找寻被拐多年的儿童,无异于大海捞针,对学界而言也是亟待解决的难题。基于此,优图首创跨年龄人脸识别技术,已帮助四川警方成功找回多名被拐超过 10 年的儿童。同时,该技术已上线福建省公安厅「牵挂你」防走失平台,助力更多的家庭团聚。

AI 手语翻译则是优图在「科技向善」上的另一重要成果。目前,我国残疾性听力障碍人士已达 7200 万,尽管他们能用手语进行交流,但在公共场所仍然面临着沟通难题。对此,优图推出 AI 手语翻译机,可将手语快速转换成文字,一定程度上缓解听障者的沟通障碍,助力城市的信息无障碍建设。未来,优图 AI 手语翻译机有望在医院、机场、高铁、民政窗口等公共场所部署应用。

演讲最后,吴运声表示:未来优图将持续以产业落地和科技向善为导向,持续让视觉 AI 技术带来更大的产业价值和社会价值。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。