刷新世界纪录,这家公司一年占领人脸识别、语音OS两大技术高地

摘要

短短一年的时间里,猎户星空就在人工智能两大领域——语音系统和图像识别取得卓越成绩,凭借技术积累和不断创新,猎户星空将走得更远。

在人脸识别领域中,有很多国际级别的赛事,比较著名的有:LFW 、MegaFace 等。其中,微软在2016 年提出的 MS-Celeb-1M 基准测试被誉为人脸识别年度「世界杯」。

近日,这场「世界杯」也落下帷幕,一家来自中国的人工智能公司——猎户星空在此次比赛中夺得第一名。

此外,Panasonic-NUS(新加坡国立大学)获得无限制类(可以自由使用外部数据)第一名;在小样本学习(Low-Shot Learning)子命题(Challenge 2)中,美国东北大学获得有限制类第一名;NUS-Panasonic (新加坡国立大学)获得无限制类第一名。

冠军背后:成立一年的猎户星空有着哪些故事

仔细调查不难发现,猎户星空全名为北京猎户星空科技有限公司,创立于 2016 年 9 月,竟然是猎豹移动旗下人工智能子公司。

从官方的介绍中可知:猎户星空成立初就汇聚了全球人工智能的精英人才,初创团队拥有来自美国硅谷,日本,台湾地区,中国北京,深圳等全球一流科技公司技术大牛和产品极客,博士占比近 5 成。今年 6 月份,他们还联合喜马拉雅发布了一款面向用户的小雅 AI 音箱。

作为猎户星空 AI 生态链上的第一款产品,小雅 AI 音箱背后的核心便是猎户星空全链路自研的远场语音交互系统,音箱一经推出,就获得业界和市场的好评,预售 5 万告罄。

插图2.jpeg(图为小雅 AI 音箱)

此次参加微软的百万名人识别大赛,也是猎户星空出于工业界大规模应用的层面,希望中的技术突破可以落地。赛后的技术成果也会被猎户星空运用到实际场景中,比如:门禁、机器人、移动 APP 等。

微软的百万名人识别大赛有什么不一样

据了解,2016 年 6 月,微软向公众发布了大规模现实世界面部图像数据集 MS-Celeb-1M,含有 10 万个名人的约 1000 万(10M)张脸部图片,鼓励研究人员开发先进的人脸识别技术。同时宣布的还有 MS-Celeb-1M 百万人脸识别挑战赛。该竞赛由微软研究院主办,借助计算机视觉领域顶级会议 ICCV 2017 的平台,既包括大规模人脸识别竞赛(Hard Set 及 Random Set),也推出全新的、更具挑战性的小样本学习(Low-Shot Learning)竞赛,堪称「级别最高」「难度最大」的技术赛事,竞赛实现了人脸“端到端”识别,有助于参赛模型投入现实应用。

根据比赛赛制,本次比赛的两个子命题都包括有限制类和无限制类。两者的区别在于是否可以使用外部数据。相比之下,有限制类别只能在限定的数据集内调用,比拼的是团队的算法能力。

猎户星空团队选择直接向更公平,完全纯技术比拼的有限制类别发起了攻坚战,凭借技术实力和积累,猎户星空团队获得百万名人识别子命题(Challenge 1)有限制类(只使用竞赛提供数据)第一名。

插图_meitu_2.jpg(图为比赛结果)

比赛中,他们面临的困难重重:竞赛数据噪声很大,无法直接用于训练;而整个训练数据集非常大,适合人脸模型大规模训练的模型对资源的要求又很高,很难做到又快又好。

好在团队一直以来都在算法上不断地追求极致。经过研究,他们设计了一种鲁棒的去噪算法,可以针对各类不同程度的噪声数据都进行有效地去噪。同时选择采用适合大规模训练的 triplet 模型,并创新地使用了一种巧妙的设计,在有限资源下加速了 triplet 网络的训练,也大大提升了性能。

这些创新性的做法,成为猎户星空此次比赛的杀手锏,最终猎户星空团队获得 0.75/0.606(random set/hard set)的高分。要知道,random set成绩已经达到了不使用外部数据的极限,远超以往的记录,实力碾压了去年所有团队的成绩,用比赛举办方的话来说,0.75 已经接近满分,是一个非常难以达到的成绩。而在 hard set 上 0.606 的成绩,也是远远超过去年的最好成绩(0.534)。

此时,距离猎户星空成立还不过一年的时间。在此之前,猎户星空还在另一项人脸识别国际赛事 LFW 的评测中取得了前三名的成绩。

短短一年的时间里,猎户星空就在人工智能两大领域——语音系统和图像识别取得卓越成绩,凭借技术积累和不断创新,猎户星空将走得更远。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。