星海图办了一个开发者大会,要把具身智能做成一套开放系统

摘要

在 Galaxea WDC 2026 上,星海图发布并开源新一代 VLA 基础模型 G0.5,推出世界模型 Fast-WAM、全身控制基础模型和双足人形机器人 Kengo,同时启动百万小时真实数据计划和创业孵化项目「星途计划」。这场大会释放出的信号是:具身智能的竞争,正在从单点技术展示走向模型、本体、数据与生态的系统能力比拼。

6 月 16 日,星海图全球开发者大会 Galaxea WDC 2026 在北京亦庄举行。600 余位开发者、学者、产业链伙伴、机器人企业和媒体代表来到现场,主题只有一句话:Build with Galaxea。

这句话背后,星海图想表达的并不只是「开放」。在这场大会上,它第一次完整摊开了自己的具身智能路线:发布并开源新一代 VLA 基础模型 G0.5,公布世界模型 Fast-WAM 与全身控制基础模型,带来首款自研双足人形机器人 Kengo;同时,星海图联合北京亦庄共建的数据公司「亦数智能」正式揭牌,启动「100 万小时超高质量真实数据计划」,并联合凯辉基金发布创业孵化项目「星途计划」。

换句话说,星海图正在做的,不是单独发布一个模型、一台机器人,或一个数据计划,而是试图把具身智能所需的几块关键拼图放在同一个系统里:基础模型负责智能,本体负责进入真实世界,数据负责持续训练,开发者和产业伙伴则负责把能力带到更多场景。

从「会动」到「会干活」

过去两年,具身智能行业最容易被看见的,是机器人跑步、跳舞、空翻、踢球。它们足够吸引眼球,但距离真正创造生产力,还有很长一段距离。

星海图 CEO 高继扬在大会上提出,具身智能正在经历「本能智能—作业智能—进化智能」的三重跃迁。

本能智能解决的是身体问题,让机器人能够保持平衡、行走、奔跑,像人一样驾驭自己的身体。作业智能解决的是任务问题,让机器人能够理解语言、有序操作,完成抓取、搬运、分拣、叠衣等具体工作。进化智能则指向更远的阶段:AI 不只是控制机器人,而是根据任务和场景,反向定义什么样的机器人最适合创造生产力。

这也是星海图做 Kengo 的原因。高继扬在群访中提到,过去无论是世界模型还是 VLA,更多面对的是双臂智能,而未来的 locomanipulation、whole body manipulation,也就是移动操作和全身操作,会把机器人带入更复杂的非结构化空间。Kengo 的发布,并不是为了证明星海图也能做人形,而是为了给全身作业智能准备一个可迭代的物理载体。

但星海图也在刻意区分不同能力的边界。比如 G0.5 的主力应用对象,仍然是 R1 Lite、R1 Pro 等双臂或轮式双臂产品;Kengo 现阶段更核心的技术线,是以强化学习为主的本能智能模型。未来,当本能智能和作业智能进一步融合,G 系列模型的作业能力才会逐步迁移到双足本体上。

这层边界很重要。它意味着星海图并不把人形机器人当成一个孤立品类,而是把不同本体放在同一条智能演进曲线上:轮式双臂先解决结构化场景里的作业,双足人形再进入更复杂的非结构化空间。

模型、本体和数据要一起跑

在作业智能层面,本次大会最核心的发布是 G0.5。

据公司披露,G0.5 采用统一自回归 VLA 架构,把视觉理解、语言推理和动作生成放进同一条模型链路,让机器人具备「边思考边行动」的原生动作思维能力。它可以面向未见过的新物体直接操作,面对新的布局场景自主适应,也能理解新的语言指令组合。

星海图称,G0.5 已积累抓取、放置、推拉等可迁移的基础动作单元,在全球六大权威榜单中取得第一名。与此同时,公司也公布了后续路线图:G0.7 面向长程双臂作业,G1.0 指向通用双臂作业智能。

为了让作业智能真正落地,星海图还公布了世界模型 Fast-WAM。传统路径往往是先想象未来视频,再根据视频执行动作,延迟较高;Fast-WAM 则在训练阶段学习视频世界模型,在推理阶段直接生成动作,将单步推理延迟压缩至 190 毫秒,较传统架构提速 4 倍以上。

但对具身智能来说,模型不是凭空长出来的。高继扬在群访中把数据问题拆得更具体:具身数据要铺满四个维度,动作、对象、场景和本体。human centric data 可以低成本覆盖更多人类动作和场景,robot centric data 则让模型真正适配机器人本体。两类数据共同构成具身基础模型的训练底座。

这也解释了为什么星海图要和亦庄共建「亦数智能」,并启动百万小时真实数据计划。按照规划,星海图今年将完成 100 万小时超高质量真实数据采集,未来三年迈向千万小时。高继扬表示,在 100 万小时之前,星海图看不到使用仿真数据的必要性,因为真实数据能更快、更有效地铺满上述四个空间。

这件事具体怎么干?一方面,依托亦庄开放的场景和资源,星海图会把数据采集放进真实生产、生活与工作环境;另一方面,数据采集会结合外包采集和众包采集,既有针对特定任务的专项采集,也有生产和生活伴随式采集。再加上数采设备、数据运营管线和模型训练团队的协同,形成从采集、标注到训练、应用的闭环。

在星海图看来,具身智能的数据不是简单的「素材」,而是模型能力的制高点。高继扬提到,具身智能数据与大语言模型数据不同,后者大量来自公开互联网,前者很大比例会是私有数据,且涉及工艺、场景和隐私安全。未来,数据差异会传导到模型能力差异,再传导到应用效果和商业价值差异。

真正的竞争会落到生态

如果只看硬件,机器人行业已经进入价格和供应链竞争。但星海图想强调的是,硬件成本下降并不会自动带来商业化。

高继扬在群访中说,「整机和供应链是有限游戏,智能和应用才是无限游戏。」他的判断是,未来两年左右,轮式双臂和双足人形等产品的硬件成本有望稳定在 1 万美金左右,甚至更低。但真正决定商业化潜力的,不是这台机器有多便宜,而是它的大脑能不能完成一个岗位、一个任务、一段生产流程。

这也是星海图对商业化节奏的判断:当前具身智能成熟市场主要还是开发者、科教研,以及展演娱乐;下一阶段才是面向生产力场景的方案订阅。现在强行把还不够成熟的模型部署到生产场景,未必是资产,反而可能成为负债。

因此,星海图把大会主题定为 Build with Galaxea,并不只是邀请开发者试用开源模型。它要建设的是更大的生态:数据侧,联合蚂蚁数科、百度智能云、海天瑞声等企业成立数据生态联盟,构建从采集、标注到应用的链路;投资侧,联合凯辉基金发起「星途计划」,孵化具身智能早期创业团队;产品侧,则通过 R1 PRO、R1 Lite、A1Z 机械臂、Kengo 等不同本体,为物流供包、工业零部件分拣、柔性织物折叠、泛化抓取等场景提供入口。

这套路径的核心,是把具身智能从单点 demo 推向可持续迭代的系统。模型需要数据,本体需要智能,场景需要开发者和产业伙伴,生态也需要更多创业团队共同补齐传感器、数据设备、制造、应用和服务等长链条环节。

高继扬在演讲结尾说,没有任何一家公司能够独自定义具身智能,唯有全球开发者、客户和产业伙伴携手,才能创造未来。

这或许也是 2026 年具身智能真正的分水岭:行业不再只比谁的机器人动作更炫,而要开始比谁能把模型、本体、数据和生态真正跑起来。星海图给出的答案,是把具身智能做成一套开放系统。

 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。