
解决了具身智能的数据难题,让机器人高效干活。
如果把过去三年中国最拥挤的创业赛道列一张清单,「具身智能」一定排在前面。
但在 2021 年,「具身智能」这个概念还远未进入大众视野,而跨维智能,正是在那个时间点成立的。
一直以来,跨维智能创始人、同时也是香港中文大学(深圳)终身教授、全球 Top 2% 顶尖科学家的贾奎和团队认为,从第一性原理出发,AI 要想真正融入物理世界,就必须学会理解三维空间与牛顿力学。
然而,相关的数据哪里找?
在整个行业还在为真实数据采集的成本与效率焦头烂额时,跨维智能给出了自己的解决方案。他们打造了名为 DexVerse™ 的具身智能引擎、与 GS-World 生成式仿真世界模型,通过让机器人在虚拟世界中「做梦」,通过 100% 生成式仿真数据,来训练出能在现实世界稳定、精准、高效完成任务的「大脑」。
贾奎回忆,在最初的两年,没有风口、没有政策红利,团队只能带着原型机拜访工厂,靠一次次 POC、一次次证明价值,说服客户共创。「没有什么捷径,就是拿真实价值去换订单。」
这是一条少有人走的路。然而,正是这份对底层技术的笃信,让他们构建了一套独特的「世界模型」技术范式,并最终实现了从「拿着锤子找钉子」的科学家创业,到年营收破亿,客户遍及中车、广汽、美的、海尔、海信等头部制造企业。
如今,随着技术成熟和行业认知变化,客户开始主动找上门来,业务进入快速增长期。但在他看来,真正重要的不是营收数字,而是:具身智能,第一次在现实世界中,形成了可复制的生产力。「如果技术不能穿过商业这道窄门,那它永远只是实验室里的想象。」
前不久,跨维智能又开源了 GS-World 的核心基建 EmbodiChain——相当于一条永不停歇的「在线数据流和模型生产线」,来推动生成式仿真成为行业标准。

跨维智能的世界模型任务示例
借此契机,我们与贾奎聊了聊跨维智能的技术路径和商业逻辑。不难得出,从 2016 年埋首于三维物理 AI 的研究,到 2021 年在「非共识」中创业,再到今天成为具身智能赛道一股不可忽视的力量,跨维智能的故事,是一个关于长期主义和「第一性原理」的样本。
让机器人「做梦」,解决数据困境
在大模型浪潮之后,行业很快意识到:具身智能需要 scaling law;而 scaling law 的前提,是数据。
和大语言模型不同,具身智能需要的不是文本数据,而是三维物理世界的多模态数据——视觉数据、力感知数据、机器人动作数据、电机信号数据。这些数据,在互联网上根本找不到。
早期,行业的主流思路是真机采集:用遥操作的方式,让人类控制机器人完成动作,记录数据。但这条路,逐渐被证明困难重重。
「真机采集的成本太高,而且效率极低。」贾奎直言,这种方式根本无法启动具身智能的规模化定律。行业不可能为了训练一个机器人拧螺丝的模型,就搭建无数条产线;也不可能为了让机器人适应不同的场景,就采集所有可能的数据。
跨维智能提出的解决方案是——GS-World 生成式仿真世界模型。简单来说,就是让机器人在虚拟世界「做梦」,在现实世界干活。

空间与具身智能视觉套件应用在空调卤检环节
这个方案的核心逻辑,源于一个科学的第一性原理:具身智能的本质,是让机器学习物理世界的运行规律。而 GS-World,就是一个严格符合牛顿物理体系的虚拟世界,区别于只注重渲染表真层面的世界模型,跨维智能世界模型更加注重其内部的物理规律。
简单来说,在这个虚拟世界里,跨维智能可以生成各种各样的三维场景、零件和任务。一条真实的种子数据,投放到 GS-World 中,就能自动生成上万条不同场景、不同工况的数据。这些数据覆盖了零件的不同摆放位置、不同的光照条件、不同的操作力度,能让机器人模型学到足够的鲁棒性。
更关键的是,用 GS-World 训练出来的模型,不需要真机数据做微调,就能直接在现实中应用。「全行业只有我们,能做到 100% 用仿真数据训练模型,真机成功率达到产品级要求。」贾奎表示。
这种技术范式,不仅解决了数据的痛点,还大大降低了成本。据透露,基于 A100 八卡的服务器,几个小时就能生成上万条数据。相比真机采集,效率提升了不止一个量级。
在工厂的实际应用中,这种技术的优势体现得淋漓尽致。比如,跨维智能的机器人能在户外完成分拣任务,这在过去是完全无法想象的;它还能实现多物料的柔性分拣,适应不同的生产需求。
「仿真才是具身智能的终极路线。」贾奎坚定地说,真机采集本质上是在浪费社会资源。而 GS-World 的出现,让具身智能的发展,从靠人力堆数据,转向了靠算力生成数据。
数据平权后,具身智能机器人的未来
2024 年底,跨维智能推出了自己的人形机器人产品 DexForceW1;截止到 2025 年底,这款产品批量出货超过百台,正式切入商业服务赛道。
据介绍,跨维智能的业务版图,清晰地分为两大板块:智能制造和商业服务。智能制造板块,核心是卖「大脑」——PickWiz 智能制造软件,结合 XEMA、KINGFISHER 等视觉传感器,适配市面上主流的工业机器人,在智能制造场景进行手眼脑协同操作。商业服务板块,则是跨维的第二增长曲线,核心是软硬一体的人形机器人,应用在咖啡售卖、商超零售、文旅导览等场景。

机器人商超店员
「我们的人形机器人,不是凭空造出来的。」贾奎解释道,它的核心还是跨维的具身智能大脑,只是换了一个人形的本体。而选择人形本体,是因为商业服务场景更需要通用的形态——人能到的地方,人形机器人就能到。
对于跨维智能来说,从工业到商业的扩张,靠的不是形态的变化,而是技术范式的胜利。
GS-World 的技术,不仅能支撑工业场景的复杂任务,也能快速适配商业场景的需求。比如,训练一个机器人卖咖啡的模型,不需要搭建真实的咖啡店场景,只需要在 GS-World 中生成相关数据,就能快速完成训练。
这种技术的通用性,让跨维智能可以在短时间内,切入不同的场景。而这,恰恰是真机采集路线无法做到的。
当被问及「数据平权后,具身智能企业的壁垒是什么」时,贾奎给出了一个清晰的答案:范式的胜利,以及产品化和商业化的能力。
「未来,数据不会再是壁垒。」贾奎说,行业发展的趋势,是数据平权。而真正能区分企业优劣的,是三个方面:
一是是否站在正确的技术范式上;二是能否找到自己的价值定位,做好产品和服务;三是能否整合供应链,形成自己的品牌和影响力。
在贾奎的眼中,具身智能的终极目标,是成为物理世界的通用智能。而这个目标的实现,需要行业共同努力。为此,跨维智能选择开源自己的工具链,推动行业的发展。
「具身智能机器人是终极的智能终端,它能带动整个生态、产业链和供应链的发展。」贾奎说,这个赛道足够大,容得下更多的企业。他预测,一旦具身智能的数据问题得到解决,这个赛道头部公司的价值,将是大模型公司的至少 10 倍。
2026 年,可能就是这场远比大模型更深刻的生产力革命的元年。



