黄仁勋：「核弹工厂」即将上线，要让所有人用上生成式 AI

「20 年前我们推出了 RTX 显卡，5 年前我们将图形计算与 AI 结合，推出了「星战」Demo。」

美国当地时间 8 月 8 日早上，英伟达创始人、CEO 黄仁勋在世界计算机图形会议 SIGGRAPH2023 上，开场回顾了英伟达在图形计算上的高光时刻，并且展示了最新的实时渲染的 4K 分辨率的 3D 赛车追逐 Demo。

不过，仅仅几分钟后，「皮衣教主」的演讲，就从 3D 图形完全过渡到 AI 上了。作为人工智能浪潮中最重要的人物，黄仁勋为「普及生成式 AI」提供了更生猛的硬件，和更智能的应用和平台。

当天，黄仁勋曝光了用于生成式 AI 的 GH200 Grace Hopper 超级芯片、NVIDIA AI Workbench 以及通过生成式 AI 和 OpenUSD 升级的 NVIDIA Omniverse。

同时，黄仁勋还宣布英伟达与 AI 开源社区 Hugging Face 合作，将把生成式 AI 超级计算能力交付给数百万开发者，为他们构建大型语言模型（LLM）和 AI 应用提供支持。

「还是那句话，买的越多，省的越多。」即使到了现在，黄仁勋依然不改金牌销售的风格。

「核弹工厂」，即将上线

「生成式 AI 时代的来临，就像 iPhone 时刻一样。」黄仁勋感概，英伟达加速计算的旅程与深度学习研究人员的旅程相遇，现代人工智能的大爆炸发生了。

五年前，英伟达通过在 GPU 上引入 AI 和实时光线追踪，重新定义了图形技术。但是「当我们通过 AI 重新定义计算机图形时，我们也正在为 AI 重新定义 GPU」。

结果就是，出现了越来越强大的系统，例如 NVIDIA HGX H100，利用八个 GPU，总计 1 万亿个晶体管，比基于 CPU 的系统提供了显著的加速。

黄仁勋展示 GH200 芯片｜英伟达

五年后，为了继续推动 AI 发展，英伟达推出了 Grace Hopper 超级芯片，即 NVIDIA GH200，它将 72 核 Grace CPU 与 Hopper GPU 相结合，提供 1 EFLOPS 的 AI 算力和 144TB 的高速存储，并于今年 5 月全面投产。

对于 GH200，黄仁勋在演讲又拿出了看家金句，「如果我可以请你记住我今天演讲中的一件事，那就是，未来属于加速计算，你买的越多，你省的越多」。

NVIDIA GH200 最可怕的不是性能强悍，而是近乎疯狂的「可扩展性」。

GH200 Grace Hopper 超级芯片平台。该平台连接多个 GPU，用于处理复杂的生成式工作负载，包括大型语言模型、推荐系统和矢量数据库。据称，与前一代相比，双配置的内存容量是之前的 3.5 倍，带宽是之前的 3 倍，服务器配备 144 个 Arm Neoverse 核心、8 petaflops 的 AI 性能和 282GB 的最新 HBM3e 内存技术。预计 2024 年第二季度将有客户基于该平台推出自己的系统。

GH200 组成的 AI 超算实体大小图｜英伟达

根据老黄的说法，在相同的成本（1 亿美元）下，2500 块 GH200 组成的计算中心，在 AI 计算的能效上，要比传统的 CPU 计算中心高 20 倍。

如果说上千块 GH200 适用的对象是「前沿大语言模型」，对于已经成为「主流」的模型，英伟达也提供了能被普通人和公司使用的、成本更低的产品。

基于专业图形应用需求，如计算机辅助设计和数字内容创作，英伟达还发布了基于 Ada Lovelace 架构的 RTX 4000 20GB、RTX 4500 24GB 和 RTX 5000 32GB，分别能提供 26.7、39.6、65.3 FP32 TFLOPS 的计算性能。

英伟达推出搭载 L40S GPU 的 OVX 服务器产品｜英伟达

此外，英伟达还推出了搭载 L40S GPU 的 OVX 服务器产品，每台服务器最多可以装八个 L40S GPU，每个 GPU 有 48GB 内存。对于具有数十亿参数和多种数据模态的复杂 AI 工作负载，相较于 A100 Tensor Core GPU，L40S 能够实现 1.2 倍的生成式 AI 推理性能和 1.7 倍的训练性能。

「专为生成式 AI 时代打造的 AI 超算」，GH200 的 PPT 页面上如此写道。

联手开源，「普惠生成 AI」

为了加速各类企业定制生成式 AI，黄仁勋宣布，英伟达推出「AI Workbench」。

据称，它为开发人员提供了一个统一、易于使用的工具包，可以在个人电脑或工作站上快速创建、测试和微调生成式 AI 模型，然后将其扩展到几乎任何数据中心、公有云或 NVIDIA DGX Cloud。

AI Workbench 主要降低企业启动 AI 项目的门槛。通过在本地系统上运行的简化访问界面，它允许开发人员从流行库（如 Hugging Face、GitHub 和 NGC）中微调模型，使用自定义数据。然后，这些模型可以在多个平台之间共享。

黄仁勋介绍英伟达 AI Workbench｜英伟达

全球各地企业都在竞相寻找合适的基础架构并构建生成式 AI 模型和应用，尽管现在已经有数以千计的预训练模型可用，但是使用许多开源工具进行定制可能仍具挑战性且耗时。

「为了使这种能力普惠，我们必须使其能够在几乎所有地方运行。」黄仁勋称，「让所有人都能参与生成式 AI。」

借助 AI Workbench，开发人员可以只需点击几下就可以定制和运行生成式 AI。它允许他们将所有必要的企业级模型、框架、软件开发工具包和库汇集到一个统一的开发者工作区中。

据称，包括戴尔、惠普、Lambda、联想和 Supermicro，都正采用 AI Workbench，因为它可以将企业生成式 AI 能力带到开发人员希望工作的任何地方，包括本地设备。

在演讲中，黄仁勋展示了 AI Workbench 和 ChatUSD 如何将所有这些功能结合在一起：允许用户从 GeForce RTX 4090 笔记本电脑启动项目，并随着项目变得更加复杂而无缝扩展到工作站或数据中心。

据黄仁勋展示，用户可以提示模型生成一张玩具黄仁勋在太空中的图片，但初始模型提供的结果不适用，因为它从未见过玩具黄仁勋，这时候用户可以用八张玩具黄仁勋的图片微调模型，然后再次输入提示，获得正确的结果。

使用提示词创建出的黄仁勋人偶上太空｜英伟达

然后，使用 AI Workbench，新模型就可以部署到企业应用程序中。

黄仁勋还宣布了英伟达与 Hugging Face 的合作伙伴关系，后者拥有 200 万用户，或将使英伟达的生成式 AI 计算能力成为数百万开发人员构建大型语言模型和 AI 应用的工具。

作为合作的一部分，Hugging Face 将提供一个新的服务——「训练集群即服务」（Training Cluster as a Service），由 NVIDIA DGX Cloud 提供支持，该服务将在未来几个月内推出。

开发人员将能够在 Hugging Face 平台内访问 NVIDIA DGX Cloud AI 超级计算，以训练和微调先进的 AI 模型。据悉，Hugging Face 社区已分享超过 25 万个模型和 5 万个数据集。

「这将是一个全新的服务，将世界上最大的 AI 社区与世界上最好的训练和基础设施连接起来。」黄仁勋称。

ChatUSD，对话式「3D 生成」

就在本周，英伟达、苹果、Adobe 和 Autodesk 等公司联手成立 OpenUSD 联盟，将这个诞生于皮克斯的 3D 标准，推向更广阔的世界。

而将 OpenUSD、AI 以及 Omniverse 结合，设计和开发人员将能通过 ChatUSD 这样的对话式界面，直接用自然语言修改和创建 3D 环境及物体，极大简化 3D 制作流程。

黄仁勋介绍 OpenUSD 联盟｜英伟达

该联盟将标准化并扩展 OpenUSD，这是开源的通用场景描述框架，是实现互操作性的 3D 应用程序和项目的基础，涵盖从视觉效果到工业数字孪生的各个领域，如连接电影和动画流程，创建真实精确的实时数字工厂、仓库、城市甚至地球数字副本等。

英伟达和 Adobe 还计划将 Adobe Firefly（Adobe 的创意生成式 AI 模型系列）作为 API 提供在 Omniverse 中。

据悉，Cesium、Convai、Move AI、SideFX Houdini 和 Wonder Dynamics 等 AI 工具现在已经通过 OpenUSD 连接到 Omniverse。

使用 OpenUSD，各个管线的工具可以同时使用一个素材和场景｜英伟达

例如，Wonder Dynamics 通过新的 OpenUSD 导出支持，可以自动将计算机生成的角色动画、灯光和合成到现实场景中。Move AI 可以使用 Move One 应用程序进行单摄像机运动捕捉，可以生成 3D 角色动画，然后可以导出到 OpenUSD 并在 Omniverse 中使用。

现在，Omniverse 用户可以构建与其他基于 OpenUSD 的空间计算平台（如 ARKit 和 RealityKit）兼容的内容、体验和应用程序。

另外，黄仁勋还宣布了由英伟达构建的四个新的 Omniverse Cloud API，包括 ChatUSD、RunUSD、DeepSearch 和 USD-GDN Publisher，供开发人员更无缝地实现和部署 OpenUSD 管道和应用程序。

使用 ChatUSD，可以用自然语言修改右边的 3D 模型｜英伟达

其中，ChatUSD 可以回答 USD 知识问题或生成 Python-USD 代码脚本；RunUSD 可以将 USD 文件转化为渲染图像；DeepSearch 可以实现语义 3D 搜索；USD-GDN Publisher 可用于发布基于 OpenUSD 的高保真体验，实时流式传输到 Web 浏览器和移动设备。

英伟达 Omniverse 和模拟技术副总裁称，「工业企业正在竞相将其工作流数字化，这增加了对启用 OpenUSD 的、连接的、可互操作的 3D 软件生态系统的需求。」「最新的 Omniverse 升级让开发人员通过 OpenUSD 利用生成式人工智能来增强他们的工具，同时允许企业构建更大、更复杂的全球规模模拟，作为其工业应用的数字测试场。」

目前都有谁在用 Omniverse？据黄仁勋介绍，科技公司正在用它测试和模拟协作机器人，亚马逊用它模拟车队将仓库数字化，汽车厂商如梅赛德斯用它来模拟自动驾驶汽车，宝马用它模拟新的电动汽车生产线，将全球工厂网络数字化，Deutsche Mind 用它创建铁路网络的数字孪生，甚至还有公司用它创建地球的数字孪生，即地球的气候系统等等。