联合实验室世纪之路 北京智源研究院带来了别具一格的走法

摘要

英国女作家玛丽•雪莱(Mary Shelley)在她于1826年发表的长篇科幻小说《最后一人》(The Last Man)中写道:“智能让我们不再对天堂充满幻想,对于目前存在于地球上的悲痛与苦难,十万年后智能会将其摆平。”

 英国女作家玛丽•雪莱 (Mary Shelley) 在她于 1826 年发表的长篇科幻小说《最后一人》(The Last Man) 中写道:「智能让我们不再对天堂充满幻想,对于目前存在于地球上的悲痛与苦难,十万年后智能会将其摆平。」

  十万年太久,一群中国科学家只想争朝夕。

  旨在发掘新生代研发精英,推进人工智能原始创新,2019 年 4 月 16 日,北京智源人工智能研究院正式举办「智源学者计划启动暨联合实验室发布会」,向外界介绍了「智源学者计划」及「北京智源联合实验室」的目标与进展,同时发布了迄今为止全球最大的物体检测数据集 Objects365。

  据透露,智源科技体系包含智源学者计划、智源科技项目与智源联合实验室三级架构。

  其中,智源学者计划旨在面向当前和未来人工智能创新发展,选拔并培养一批德才兼备、具有国际影响力的学科领军人才和具有发展潜力的青年学术英才,目前支持首席科学家 (Chief Scientist)、研究项目经理、研究员、青年科学家等四类人才的发掘和培养,经过缜密公正的管理办法与工作流程,拟于 2019 年遴选 100 位智源学者,其中重大方向 5 至 7 位,青年科学家 30 至 50 位。发布会上公布了首批智源学者候选人名单与简介。

  智源科技项目着眼于突破性项目和探索性项目,旨在以项目为抓手,开展基础理论、领域应用研究。

  智源联合实验室则定位于协同创新平台,是研究院面向人工智能未来发展,围绕重大应用需求,联合各大高校、科研院所、优势企业等机构进行全方位科研合作的枢纽。研究院已和北京旷视科技有限公司合作共建了智能模型设计与图像感知联合实验室。

  北京智源人工智能研究院 (Beijing Academy of Artificial Intelligence,BAAI) 于 2018 年 11 月正式挂牌成立。作为北京智源行动计划的重要支持力量,北京智源人工智能研究院是北京市继脑科学与类脑研究中心、量子信息科学研究院之后,着力建设的又一个重要的新型研发机构。研究院集合了北京大学、清华大学、中国科学院、百度、字节跳动等在人工智能领域拥有深厚积淀的高校、机构、企业,致力于建立新的科研组织形式与人才引进培养模式,以推动人工智能发展方向和理论、方法、工具、系统等方面的关键性突破。北京大学计算机系主任黄铁军担任首任院长。

  欲掌控趋势 先直面不足

  过去十多年来,随着计算的重心由桌面转向云和移动端,信息技术的演进亦骤然加速。

  「云数智物」,云计算、大数据、人工智能、物联网等技术彼此支持、相互促进。它们在自身不断发展的过程中,又扮演着工业革命 3.0 到 4.0 的「升级补丁」(Patch) 角色。需要强调的是,「云数智物」四大技术中,人工智能又是重中之重。在云计算的算力支撑下,IoT 物联网的海量接入节点将进一步使大数据呈现指数级增长。将这些「Bigger than bigger」的数据转化为知识决策,进而创造出新的商业价值与体验模型,就只有在人工智能的加持下才能实现。

  趋势已很明显。「云数智物」等技术将推动今后十年甚至更长时间里中国经济的高质量发展,驱动传统行业转型、商业模式创新与用户体验延伸——然而,比发现趋势更可贵的是紧随趋势,比紧随趋势更可贵的是掌控趋势。

  想要掌控趋势,就必须先直面往昔三十多年来中国 IT 产业在创新领域存在的不足。对此,汇聚了国内顶尖学术领袖与互联网行业精英的北京智源人工智能研究院认为,尽管历经多年砥砺与积淀,中国已在诸如移动支付、共享服务及人工智能部分分支课题领域取得了不凡的成就,但总体上,在基础理论、核心算法及关键设备、高端芯片、重大产品与系统等方面,中国企学界与当前处于全球最前沿的同行们相比仍存在较大差距。而且,包括领军者、原创性研究者、高端复合型研究者在内,顶尖人工智能人才的缺乏也是不争的事实。同时,产业生态系统仍不够健全——表现为开源开放创新平台影响力弱、政策及配套设施有待完善、科研力量缺乏持续性资助、企业投入基础研究动力不足等。这些因素都导致了里程碑式的标志性研究成果产出困难。

  挑战组织形态壁垒 智源联合实验室能否成为联合科研模式的变革者?

  基于对技术趋势与现实短板的洞察,北京智源人工智能研究院希望在充分借鉴国内外成功实验室和研究机构经验的前提下,聚焦基础研究,对接学术课题与企业资源,对接研发思路与应用需求,探索出一条先人一步 (前瞻的)、快人一步 (高效的) 的科技体制与机制创新之路。

  也就是说,与其他研究机构相比,研究院的存在更接近于创新计划的制定者、创新行动的组织者、创新资源的连接者、创新结果的裁决者。

  科学研究——特别是基础性、原创性的研究往往具有较大的不可预测性,需要长期、深入的探索,及对探索过程与结果的包容。长期以来,国内的科研资助模式主要是以项目为中心,科研人员通常会围绕项目进行申请、答辩及同行专家评审等。然而这种模式更适合工程类项目,对于创新型研究则不太适用——因为绝大多数具有突破性的研究工作在初期都难以获得同行的普遍认可。由于科学研究的不可预期性,通过项目答辩方式进行的科研大多只能做跟进式研究,而难以开展基础性、原创性、颠覆性的工作。

  上世纪七十年代,在施乐公司帕洛阿尔托研究中心 (Xerox Palo Alto Research Center) 诞生了从个人电脑到图形用户界面、从激光打印机到鼠标等一系列深刻影响后世的技术雏形。虽然由于时代与自身原因,施乐公司未能及时利用这些研究成果,但 Xerox PARC 贡献的灵感却成为了 PC 时代的火种,启迪了包括苹果、微软在内的跨国巨头对于技术与产品的想象。很明显,Xerox PARC 虽未亲手按下信息爆炸的按钮,却大大缩短了创意变现与产品落地的时间。今天,在人工智能研究领域,中国不仅需要应用与体验层面的创新者,也需要像 Xerox PARC 这样距梦想更近、距功利较远的创新种子机构。因此,北京智源人工智能研究院在变革科研资助模式方面的尝试可说是很有必要且恰逢其时。

  不仅如此,人工智能技术也不同于传统技术。就像某种「加工式」生产模式,人工智能需要利用海量的数据原料,通过学习模型与评价,对系统进行训练,最终开发出可替代原本复杂任务的工具。换言之,真实场景、大规模、高质量的数据已成为促进人工智能技术发展及应用孵化的核心动力。但客观现实是,作为训练资源的数据一般都掌握在大型企业手中,高校院所、初创企业以及个人很难触及。另一方面,尽管大公司掌握着海量数据,有机会训练出性能领先的人工智能产品,但其数十人规模的研究团队和国内从事同类研究的科研工作者相比只是沧海一粟,并不能充分发挥出所拥有数据的潜力。科技企业、高校院所、科研社区之间被组织形态的高墙深壑互相隔了起来,数据资源无法有效流动,产生更多的可能性更是无从谈起。

  如何打破数据孤岛,以开放、共享、竞争、共赢的方式进一步促进人工智能的发展成为当下亟待解决的问题——北京智源人工智能研究院给出的方案是智源联合实验室计划。通过选择在人工智能技术领域有资源、有优势的企业共建实验室,研究院将拥有数据的企业方及希望借助大规模、高质量数据优化和验证模型算法的科研单位、小微双创公司乃至个人开发者连接在一起,使后者也能利用大公司的数据加速创新。

  另一方面,联合实验室的成立对于共建单位旷视科技来说,也有着不同寻常的意义。

  智源-旷视联合实验室副主任周舒畅表示,作为人工智能科技企业,旷视科技与很多同行们一样,通过定期发表论文、数据集等形式维护了人工智能开放研究这一传统。但作为研究行为来说,并没有稳定的预期和出口。如果科技企业维持单打独斗这一现状的话,取得的成果依然有限。举例来讲,当数据集脱离实验平台的时候,就相当于大幅提高了利用数据集的门槛,这是任何人都不乐见的。通过与智源共建联合实验室,研究资源和研究成果能够有效触达更多的人,帮助研究者开发者形成社区,让已经开放的东西发挥更大的价值,达到百花齐放的效果。这对企业来说,更加符合开放研究的本意。不仅如此,联合实验室在回馈社区的同时,共建企业的影响力也会在无形中得到持续放大。

  黄铁军院长表示,智源联合实验室不需要开发者们的知识产权。他对于智源联合实验室的定义是浇水的人,开发者则是种树的人。在智源联合实验室经费支持下产出的科研成果,将全部归承担相关任务的依托单位所有。「打造平台只是为开发者提供助力,真正释放创造力的是开发者们自己。」他说。

  全球最大物体检测数据集 Objects365 发布

  发布会上,作为首个智源联合实验室计划的首个落地项目,由智源研究院与北京旷视科技有限公司共同打造的「北京智源-旷视智能模型设计与图像感知联合实验室」。这个全新模式的实验室所迈出的第一步便是发布迄今为止全球最大的物体检测数据集 Objects365。

  十年前,由李飞飞教授率团队在 CVPR 2009 大会上发表的一篇论文《ImageNet:大规模分层图像数据库》(ImageNet: A Large-Scale Hierarchical Image Database) 很快演变为一场全球人工智能研究者的竞赛。2017 年,这场竞赛落下了帷幕,从识别率看,机器已超越人类。但对更大规模数据原料与完美算法的追求却远未停止——正如李飞飞教授所说:数据和算法同等重要。

  通过联合实验室,北京智源人工智能研究院正与合作企业携手搭建世界上最大规模的通用物体检测数据集,这一计划看起来就像是与 ImageNet 的一场火炬接力。按照计划预期,Objects365 数据集图片数量将达到 200 万张图片,标注框总数达到 2400 万个,并支持 365 类物体的检测,可覆盖日常生活中大部分的物体类别。同期,依托于 CVPR 2019 大会,研究院还将举办 Detection in the Wild 比赛——研究院想要借助该比赛,吸引更多的业内人士参与,提升 Objects365 数据集的影响力。

  据介绍,任何数据集都有两个关键指标:量与质。「量」是指数据集的大小、规模,比如某个单类别的数据集拥有几十张甚至几百张图,看似庞大,实则远远不够。「质」是指标注的精度,它直接影响了机器对「规律」的判断。就目前的精度标准来看,Objects365 的精度是现阶段所有数据集中最高的,这是因为实验室采用了一种反复迭代的标注方法。当数据被标注完后,联合实验室会拿去测试,包括自测和来自平台使用者的测试。一旦发现标注不对,那么这个数据就会被回炉重造,直至标注正确后才会再次释出。

  为什么 Objects365 要投入这样的成本去进行高精度标注? 以往,数据集的作用是制作雏形和初步印证,服务于那些想要把思想火花变成实际产品的开发者。他们由兴趣和爱好驱动,当他们的设想在传统数据集得到证实时,才会接着寻求学术突破或实际落地场景。Objects365 则有所不同,除了基础层面的研究外,还支持技术垂直领域的拓展。无论是简单的人脸识别,又或是在结构化图片中识别物体,怀抱不同目的的开发者都能达成预期。

  此外,Objects365 格外强调交流的意义——类似于 Workshop,Objects365 允许使用者查看垂直领域领军人物的作品,也提供开发者之间交流的空间。联合实验室希望让更多想法不同的开发者能够及时相互碰撞,并点亮新的灵感火花。

  写在最后

  从长远来看,任何国家想要在一项先进技术上取得领先地位,都必然要把最好的资源投放给最合适的团队,并联结各界伙伴、合力进取,而不是闭门造车。过些年再看,智源联合实验室的成立或许会成为中国在人工智能研发领域的里程碑事件,比起技术突破和应用创新,联合实验室的独特价值在于,尝试以新型平台的搭建来集聚创新者、影响技术演进路线。

  关注变革与超越,加速布局智能未来——成立仅半年时间的北京智源人工智能研究院已开始合纵生态圈伙伴、共探智能之极。无论是智源学者计划还是智源联合实验室模式,都展现了研究院以「高质量创新」引领「高质量发展」的雄心。或许可以期待这所由计算机领域顶尖专家组成的机构能够为中国科技进步与传统产业升级提供更强劲的动力。


最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。