NVIDIA 开源模型与仿真库,加速机器人研发进程

摘要

通过开源物理引擎Newton、机器人基础模型Isaac GR00T N1.6以及一系列配套的仿真、数据和硬件工具,NVIDIA正系统性地为机器人构建“身体”、“大脑”与“训练世界”。

在科技行业的发展历程中,总有一些关键的节点会预示着产业方向的重大转变。对于方兴未艾的物理AI(Physical AI)和人形机器人领域而言,2025年9月29日或许就是这样一个值得被标记的时刻。

在韩国首尔举行的机器人学习大会(CoRL)上,NVIDIA没有发布单一的芯片或软件,而是铺开了一幅完整的机器人未来蓝图。通过开源物理引擎Newton、机器人基础模型Isaac GR00T N1.6以及一系列配套的仿真、数据和硬件工具,NVIDIA正系统性地为机器人构建“身体”、“大脑”与“训练世界”。这不仅是一次技术迭代,更是一次清晰的战略宣告:NVIDIA正加速构建一个从代码到行动的端到端生态,致力于成为物理AI时代的基础设施提供者。

“人形机器人是物理AI的下一个前沿,需要能够推理、适应并在不可预测的世界中安全行动。” NVIDIA Omniverse与仿真技术副总裁Rev Lebaredian的这番话,被各大媒体置于报道的核心位置。这并非一句简单的公关辞令,而是NVIDIA机器人战略的纲领。它清晰地勾勒出一个三位一体的宏大愿景:

  • Isaac GR00T 充当机器人的“大脑”,负责思考与决策。
  • 物理引擎Newton 模拟机器人的“身体”及其与物理世界的交互。
  • NVIDIA Omniverse 则是机器人进行学习和演练的“训练基地”或“数字孪生世界”。

 

物理引擎Newton:开创机器人物理仿真新标准

机器人研发的核心痛点之一,在于如何精准地预测其在复杂物理世界中的行为。为此,NVIDIA正式推出了开源物理引擎Newton的测试版。它被海外媒体精准地概括为“虚拟到现实的加速器”,其使命是为机器人从仿真走向现实铺平道路。

根据官方资料,Newton是一款由Linux基金会管理的GPU加速物理引擎,由NVIDIA与谷歌DeepMind、迪士尼研究院这样的行业巨头联合开发,并基于NVIDIA Warp和OpenUSD框架构建。其核心价值在于解决了当前物理引擎面对人形机器人复杂多关节、动态平衡和精细操控时的性能瓶颈。凭借其灵活的设计和对多种物理求解器的兼容,开发者现在可以大规模、高效率地模拟此前难以实现的复杂动作,例如让机器人在雪地或碎石路面上稳定行走,或是操控杯子、水果等易变形、易碎的物体。

在行业观察者看来,Newton的发布是“缩短仿真与现实差距”的关键一步。它让开发者能够在虚拟世界中进行更逼近真实的测试,从而确保机器人在仿真环境中习得的技能,能够安全、可靠地迁移到现实世界。包括苏黎世联邦理工学院机器人系统实验室、慕尼黑工业大学以及光轮智能(Lightwheel)、Style3D在内的前沿学术机构和公司已率先采用Newton。不过,也有财经类媒体谨慎提示,Newton仍处于测试阶段,其最终性能的兑现和全面落地的时间表,值得业界持续关注。

Cosmos Reason与Isaac GR00T N1.6:优化机器人推理能力

如果说Newton解决了机器人“身体”的物理法则,那么NVIDIA的下一步就是为这具身体注入“灵魂”——即接近人类的推理能力。为此,最新发布的 Isaac GR00T N1.6(即将在 Hugging Face 上线),将集成 NVIDIA Cosmos Reason——一款面向物理 AI 的开源、可定制推理 VLM。

这两者的组合被媒体广泛描述为“机器人的大脑”。其核心突破在于,让机器人从过去只能执行逐条明确指令的自动化工具,进化为能够理解模糊意图的智能体。Cosmos Reason能够将“收拾房间”这样模糊的指令,利用其先验知识、常识和物理原理,转化为一步步具体可执行的动作计划。正如Analytics India Magazine的精辟概括:“帮助机器人在虚拟环境中学习、在现实世界中推理并执行任务。”

其行业认可度有数据支撑:在发布时,Cosmos Reason在Hugging Face的物理推理模型排行榜上位居榜首,下载量已超过100万次。而升级后的Isaac GR00T N1.6模型,则进一步增强了机器人的多任务并发能力,使其躯干和手臂拥有更大的自由度,能够完成像“搬着物体时推开较重的房门”这类高难度任务。目前,AeiROBOT、Franka Robotics、LG电子、光轮智能等领先机器人制造商,正在评估采用Isaac GR00T N系列模型来打造通用机器人。

Cosmos世界基础模型:面向物理AI开发的“数据工厂”

AI模型的训练离不开海量优质数据,物理AI尤其如此。为了解决机器人训练数据获取难、成本高的问题,NVIDIA更新了其开源的Cosmos世界基础模型(WFMs)。该模型被海外媒体形象地比喻为“数据工厂”,其核心功能是通过文本、图像和视频提示,生成多样化、物理一致的合成数据,用来“喂养”机器人模型。

此举被认为是NVIDIA在物理AI训练闭环中的重要一环,因为它极大地减少了对昂贵且耗时的真实世界数据采集的依赖。即将推出的Cosmos Predict 2.5将整合三大模型,支持长达30秒的视频生成和多视角输出,以实现更丰富的世界仿真。而Cosmos Transfer 2.5则能在模型体积缩小3.5倍的情况下,更快、更高质量地生成照片级的合成数据。这些工具的完善,为全球开发者加速物理AI模型训练提供了强大的“燃料”。

全新工作流:系统性训练机器人抓取等复杂技能

教会机器人抓取物体是机器人领域的经典难题之一。NVIDIA在Isaac Lab 2.3的开发者预览版中,新增了“灵巧抓取工作流”。该工作流基于NVIDIA Omniverse平台,通过一个自动化的课程体系,在虚拟环境中系统性地训练拥有多指灵巧手的机器人和机械臂。它从简单的任务开始,逐步提升难度,通过调整重力、摩擦力、物体重量等参数,训练机器人在不可预测的环境中也能掌握稳定的抓取技能。一个极具说服力的案例是,波士顿动力公司的Atlas机器人已借助这一工作流,显著提升了其操控能力。

在仿真环境中评估技能:Isaac Lab Arena的标准化测试

机器人学会一项技能后,如何科学、大规模地评估其泛化能力,是另一个行业挑战。为此,NVIDIA与光轮智能联合开发了Isaac Lab Arena——一个用于大规模实验和标准化测试的开源策略评估框架。该框架旨在解决开发者自建测试场景时常出现的零散、过度简化的问题,提供一个能够在无数场景、任务和环境中对机器人习得技能进行综合评估的标准化平台,确保在仿真中表现优异的机器人,也能从容应对现实世界的复杂状况。

全新AI基础设施:为机器人工作负载提供全面支持

所有先进的软件和模型,都需要强大的硬件来承载。NVIDIA为此推出了专为高要求机器人工作负载设计的AI基础设施,完成了从云端训练到终端部署的硬件闭环。这包括:

  • NVIDIA GB200 NVL72:集成了36个Grace CPU和72个Blackwell GPU的机架级系统,面向云服务提供商,用于加速复杂的AI训练和推理。
  • NVIDIA RTX PRO™服务器:为机器人开发的各类工作负载(训练、合成数据生成、仿真)提供统一架构的工作站。
  • NVIDIA Jetson Thor™:搭载Blackwell GPU的机器人“大脑”,它解锁了机器人端实时推理和多AI工作流的能力,对于人形机器人等高性能物理AI应用是突破性的。包括Figure AI、银河通用、Google DeepMind、Meta、Skild AI以及宇树科技在内的众多知名企业,已宣布采用Jetson Thor。

结语:一个清晰的生态布局与无法回避的物理挑战

综合来看,NVIDIA在CoRL大会上的系列发布,清晰地展示了其从GPU公司向“端到端机器人生态平台”转型的决心。通过将软件(Newton, GR00T)、模型(Cosmos)、仿真平台(Omniverse)和硬件(Jetson)深度捆绑,NVIDIA正在构建一道强大的“软硬一体护城河”。近半数的CoRL录用论文引用了NVIDIA的技术,也从侧面印证了其在学术和研发领域的深远影响力。

然而,正如行业评论所指出的,尽管软件和仿真工具的进步令人瞩目,但物理AI的真正难题最终仍需回归到物理本身。机器人硬件——包括电池续航、驱动器性能、功耗控制和物理安全性——依然是限制行业发展的根本瓶颈。

尽管如此,NVIDIA的这套组合拳无疑为整个行业指明了一个清晰的方向,并提供了前所未有的强大工具。它正在系统性地推动机器人从“跌跌撞撞的实验室演示品”,朝着“具备推理能力的现实世界行动者”加速迈进。这条路依然漫长,但通往未来的高速公路,其蓝图和施工队,NVIDIA似乎已经准备就绪。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。