英伟达想让机器人在虚拟世界里「闭关修炼」

摘要

让很多人没想到的是,又一项超级英雄才拥有的能力出现在现实当中。

布朗大学实验室里有一台「维尼」,它不是小熊,而是可以摘下花瓣的机器人。像其它实验室的机器人一样,它被制造出来的目的,是完成一部分人的工作(抓取-放置物品),但在这之前,它要经历一段漫长的实验室岁月。

通过自己的机械臂和摄像头,维尼每天都在进行重复的动作,就是把雏菊的花瓣摘下,放在另一个地方。这个动作的结果时好时坏,机械臂会因为花瓣的位置不同而表现不一,所以实验室的研究者,每天都要观察它的训练进度,不断调整算法,并为它放上新的雏菊。

图片来自 New Yorker

不得不说这是一个乏味无聊的过程,研究人员不但要耗费大量时间提升机器人的智能度,更要命的是,即便训练进度再快,现实环境中有限的机器人个体对于技术训练也略显乏力。面对已经到来的 AI 技术革命,人们需要一个可以更高效,也更经济的办法加快机器人的学习进度。

假设有这样一个空间,它可以模拟真实的物理环境,遵循现实世界的运动原理、物理定律,并且可以人为控制时间快慢,那么把维尼机器人放进这个「世界模拟器」中,重复摘花瓣的动作,我们加快时间速度,是不是就能提升它的训练效率?

如果再进一步,这个「世界模拟器」中,我们可以安排十台,一百台甚至上千台维尼机器人进行同样的机器学习,并发现进步最快的,然后将它的算法进行迭代,是不是就可以在更短时间让机器人拥有更出色的动作能力,更快完成机器人的「进化」?

这是一个大胆的设想,同时也是英伟达推出基于 Holodeck VR 平台的虚拟学习环境 NVIDIA Isaac 模拟器的意义所在。10 月 24 日,英伟达正式在国内带来了 Holodeck 以及 Isaac 模拟器。

英伟达中国区虚拟现实业务开发及销售经理张武

什么是 Holodeck?如果你关注英伟达,也许在今年五月的英伟达 2017GTC(GPU 技术大会)上见到过它。作为英伟达 CEO 的黄仁勋,在大会第一个环节,就发布了这个被称为多人交互 VR 平台的 Holodeck。现场演示环节,他通过 VR 空间的连接,和网络中其他人碰面并互相协作。

那这个 NVIDIA Isaac 模拟器又是什么?和前面讲到的机器人训练又有什么关系?

Isaac 模拟器是基于 Holodeck 这一虚拟空间的机器学习工具。简单来说,它就是我们前面设想的那个「世界模拟器」,有机会帮我们提升机器人学习的效率。在 Holodeck 这样的虚拟空间里,开发者可以通过 Isaac 将机器人算法加载到虚拟机器人上,然后模拟现实世界的训练。

由于虚拟空间的巨大扩展性,开发者可以在 Isaac 内放置最多 16 台机器人进行模拟训练,同时因为遵循物理世界的运动规律,所以这些数据都和现实世界中得到的数据有相同效果,因此能加快机器人的学习效率。最终,我们在虚拟世界中得到的数据,可以输出给现实世界中的真实机器人,从而直接「进化」现实中的机器人,更值得一提的是,在虚拟空间里,这样的训练是可以不断迭代的。

「我们把这些机器人训练好之后找出最聪明的,把最聪明的机器人再放到另外 15 个机器人再做训练,重复之后就可以执行更高效、更快速和更准确的 AI 训练。」

英伟达中国区虚拟现实业务开发及销售经理张武告诉我们,虚拟空间不受时间约束,因此可以在短时间不断重复动作并发现问题,这种强化学习的方式在 VR 中变得「所见即所得」。而之所以能够实现这样的效果,就在于 Holodeck 平台自身的特性:

1,以仿生比例实时渲染高度详尽的大型模型。

2,在物理仿真环境中进行创建,并与人、机器人和物体互动。

3,在同一虚拟空间中自然地进行实时协作。

想要让 VR 平台训练机器人,单是拥有扩展性,以及现实世界的物理规律还是不完美。对于开发者来说,还需要真实世界中的光影效果,需要虚拟空间中拥有触觉感受,还需要能和他人共同协作,而这些对 Holodeck 平台同样重要。

「在虚拟环境里我们摸这个车子上可以感受到这个车子的回馈。这在设计里非常重要,今天摸到的是木头,表现出来的就是木头的材质,今天摸到的是光影就要有光和影的表达。在设计平台里同时 16 个设计师同时参与编辑同一个模型。」这种回馈可以通过 VR 设备的震动反馈实现,在将来,也许会有更丰富的表现形式。张武说,这不但适合机器学习,也适合多名设计师一起观看并修正同一产品。


尽管现场展示的仍然是今年五月份的 Demo——关于一辆跑车的设计协作。但一些细节还是值得提到的,按照张武的介绍,Holodeck 平台能通过 VR Works、Design Works 和 Game Works 这三项处理特性达到照片级的效果,包括物理约束、流体效果等特点,都可以在 Holodeck 上模拟的更真实。在视频中的这辆跑车,全车一共数万个零件,都可以精确展示,当设计师接触到车的表面时,就会有力度反馈,而手伸入内部时,可以利用测试球看到内部结构。这一点大大增强了其沉浸感。


另外一点在于多人协作,尽管我们现场并未看到能够连接其他人进行协作,但这条路线有其价值所在,今年早些时候,在 Facebook F8 大会上,马克·扎克伯格展示了具有社交属性的 VR,通过搭配上 VR 设备,你可以在虚拟空间「Facebook Spaces」中与好友面对面交流,但当时称每个用户最多能邀请三位好友。

而相比社交娱乐,Holodeck 能够连接 16 位设计师同时进入 VR 空间进行设计协作无疑让 VR 的实用性大大增强。设想一下,即便是前面提到的机器人训练,能够邀请全球各地的科学家共同在 VR 空间协作,也是一件让人憧憬的事情。


记得高中时代看《火影忍者》,主人公鸣人有一项特殊的技能,可以一瞬间分出很多个自己,像孙悟空一样。而这些分身都和本体在精神上连接,所以当主角需要学习一项复杂技能时,只需要同时分身出好几百人,每个人都学习这项技能,就可以达到好几百倍的学习效果,做到一日千里。当时看到这个情节时,我脑海里觉得这不过是作者脑洞大开的幻想,可没想到,在现实世界,这样的事情也已经出现,只不过这一次的主角不是人类,而是机器人。

当然,对于 Holodeck,目前仍旧处于内测阶段,所以我们还很好奇,它是否能够支持更多机器人同时训练(目前仅限 16 台还是略少)?是否对于网络环境要求很高?是否能达到想象中那么美好?甚至是否能够进行比如汽车碰撞、飞机飞行这样的实验?这些从脑海不断冒出的疑问,也许会伴随平台的成熟而得到答案。 (编辑:Rubberso)

打开极客公园App阅读更多内容

最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。