如祺出行构建 Ego-centric 数据自动化流水线,加快布局具身智能数据服务

摘要

加快卡位物理 AI 新赛道

6 月 22 日,如祺出行旗下数据业务板块(下称「如祺数据」)正式发布具身智能数据平台。官方信息显示,该平台核心是一套 Ego-centric 第一人称操作视频自动化处理流水线,覆盖数据导入、AI 预处理、动作标注、多级质检到标准化格式导出全流程。

这意味着,这家公司正式将其既有的 AI 数据服务能力延伸至高增长的具身智能数据处理场景。如祺出行称,新平台旨在将具身智能数据服务标准化、自动化,形成可追溯、可质检的闭环,降低第一人称数据从采集到训练的边际成本。

今年以来,全国多地明确支持具身智能领域加快发展。6 月 9 日,工信部与国资委联合启动「2026 年度人形机器人与具身智能实景实训专项行动」,计划今年底推动人形机器人等重点产品在代表性场景中开启「作业模式」,带动形成「万台级规模落地能力」。市场预期,在系列积极政策支持下,具身智能将加快进入大规模预训练阶段,而数据作为现阶段制约具身智能发展的最重要瓶颈,相关服务需求也将出现爆发式增长。

自动化流水线破解数据应用效率瓶颈

当前,具身智能的竞争重心正从本体硬件转向可供训练用的高质量物理数据。公开数据显示,全球高质量真实物理交互数据总量仅约 50 万小时,而具身智能通用模型训练则需要千万小时起步的数据量级。国泰海通证券在近期研报中直言,「数据饥荒」已成为制约具身智能泛化能力突破的主要瓶颈。

高质量物理交互数据供需严重失衡背后,除了采集困难,还有数据工具链碎片化带来的困境。

具身智能训练所需的多模态数据涵盖视觉、力觉、关节轨迹和语言指令等,对时空、因果对齐精度要求极高。但目前传统数据服务商推出的数据工具链功能大多较为分散,采集、标注、质检、格式转换和训练对接时常分布在不同工具和流程中。业内人士指出,模型训练团队往往需要花费大量精力和时间在内部搭建数据管线连通数据生产、清洗、评估、筛选等不同环节,「有时候这些成本甚至是数据采集的 3 到 5 倍。」当行业朝着真实场景落地方向加速奔跑时,从原始数据到训练就绪之间的「最后一公里」,已逐渐成为拖慢整体效率的隐形卡点。

如祺数据此次发布的具身智能数据平台,通过搭建面向 Ego-centric 数据的自动化处理流水线,覆盖数据导入、AI 预处理、动作标注、多级质检到标准化格式导出全流程,核心目标是降低 Ego-centric 数据从采集到训练的边际成本,进而突破「最后一公里」困境。

Ego-centric 数据是具身智能模型训练的关键数据形态之一。据介绍,该自动化处理流水线会在 Ego-centric 视频输入后,先将原始视频进行手部检测、相机位姿估计和手部 3D 姿态优化三阶段 AI 预处理,输出结构化轨迹,再借助面向长序列动作切片的标注工作台和五维自动质检报告,最终生成可直接对接 LeRobot、HDF5、JSON、ROS 2 MCap 等主流训练与仿真框架的标准化数据集。

平台全自动 AI 预处理三阶段流水线架构

这一过程打破了传统「数据工具链零散、标准不一」的局面,提升数据处理流程的标准化、自动化和可追溯水平,降低从原始视频到训练就绪数据之间的工程门槛,实现高质量数据开箱即用,显著优化模型训练团队的数据使用效率。

如祺出行已构建面向物理 AI 的数据能力

据了解,如祺出行自 2023 年起开始布局 AI 数据解决方案。近年,公司基于出行服务平台优势,不断合规积累高价值、多模态的物理世界数据,并围绕自动驾驶逐步构建面向物理 AI 的全链路数据能力,覆盖数据采集、处理、标注、合成及治理全流程。

目前,如祺出行在广州、上海、重庆等地常态化部署超 300 辆智能驾驶采集车,每日可贡献 1600 小时、130TB 的多模态行车与泊车数据。公司在全国布局 3 大服务交付基地,团队规模超 1,500 人,可提供每月千万级的交付标注产能,客户覆盖小马智行、理想、腾讯等头部企业。

数据显示,2025 年,如祺出行以 AI 数据解决方案为主要收入来源的技术服务板块录得营收 1.60 亿元,同比大增 487.4%,商业化能力持续获得验证。

今年 5 月,如祺出行表示将持续围绕自动驾驶、具身智能、世界模型等方向拓展数据服务能力,并同步公开其布局的 AI 数据资产版图,包括标注数据、行为数据、合成数据及多模态训练数据集。

「具身智能与自动驾驶本质上都是物理 AI,两个领域的数据服务能力在底层逻辑上相通,存在可迁移经验。」一位业内人士分析称,如祺数据的全链路 AI 数据能力已在自动驾驶领域获得验证,这成为其向具身智能扩展的基础。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。