物理 AI 领航者江行智能:「空间智能大模型」让 AI 真正看懂工业现场

摘要

当多数物理 AI 公司还在实验室里训练机器人抓取积木时,江行智能已经在零下 20 度的变电站、数百公里的天然气管网、高危煤矿巷道里,完成了超过 1000 个场站的规模化部署。

当多数物理 AI 公司还在实验室里训练机器人抓取积木时,江行智能已经在零下 20 度的变电站、数百公里的天然气管网、高危煤矿巷道里,完成了超过 1000 个场站的规模化部署。2025 年订单超 5 亿元,三年复合增长近 70%,并实现盈利——这组数据背后,是一套从「感知」到「执行」完整打通的物理 AI 引擎。而其中最核心的突破,是一个名为多模态空间智能大模型的技术底座:它能让机器像资深工程师一样,看一眼现场,就「脑补」出完整的三维场景,还能用自然语言对话、推理、推演。

物理 AI 的「最后一公里」,卡在空间理解上

能源电力、矿山、化工这些工业场景,对 AI 的要求远高于写字楼或家庭。一个变电站里,设备布局各异,仪表、开关、管线错综复杂。传统计算机视觉只能识别二维图像中的物体,却无法理解它们之间的空间关系、拓扑连接、以及背后的业务规则——比如「这个断路器控制哪条线路」「消防通道的净宽是否达标」。

没有三维空间理解能力,机器就很难真正理解现场,只能留在浅层感知。

江行智能最新发布的多模态空间智能大模型,正是要解决这个根本问题。它不再是一个单纯的感知模型,而是一个集多源异构数据感知融合、空间语义逻辑推理、三维数字孪生模型重建与生成于一体的端到端大模型。通俗讲:给它任意形式的输入——几张照片、一段文字描述、几行参数,甚至是不完整的激光点云——它都能输出一个带语义、可计算、可交互的三维空间模型。

从「重建」到「生成」:两种模式无缝切换

这套大模型最巧妙的设计,是能根据输入数据的完整度,在高精度重建和语义约束生成两种模式之间自适应切换。

模式一:高精度重建当输入数据足够丰富(比如完整场站的全量激光雷达扫描、全视角红外/可见光影像、配套的台账图纸),模型会输出 1:1 还原真实场景的高精度三维实景模型。它不仅保留每个设备的几何结构、纹理、位置,还自动绑定属性参数(如额定电压、生产厂家)、拓扑关联(如「A 开关控制 B 线路」)、以及业务规则(如巡检周期、操作规程)。这相当于给物理世界做了一个「数字双胞胎」,而且每个物件都「活」的——带语义、可查询。

模式二:语义约束生成更惊艳的是第二种能力。当输入非常稀疏——比如只有一句自然语言描述(「一个 110kV 户外变电站,两台主变,位于多雨山区」),或者几张局部照片、几个关键参数——模型不会报错,而是基于内置的行业规范库、地域特征库、典型场景知识库,自动生成一个符合逻辑、合规的完整三维空间模型。模型甚至会标注每个生成部分的置信度和设计依据,供工程师后续调整。

这意味着:哪怕现场数据不全,AI 也能「脑补」出合理的场景,并且补全的部分有据可循。这对于老旧场站改造、海外项目快速规划等场景极具实用价值。

自然语言「问」模型:能推理、能校验、能推演

输出三维模型只是第一步。江行智能的多模态空间大模型真正厉害之处在于:模型自带可交互、可推理的能力。用户可以用自然语言直接向模型提问,模型会在三维场景中高亮回答,并输出逻辑推理过程。

基础信息查询问:「这个场站的主变压器有几台?分别在什么位置?」模型立即在三维视图中闪烁标注所有主变,并弹出每台的型号、投运日期、最近检修记录。

合规性推理校验问:「这个变电站的消防通道是否符合国家规范?」模型调用内置的《变电站防火设计规范》,结合当前空间布局,自动测量通道宽度、转弯半径、疏散距离,然后输出结论:「北侧通道宽度 2.8 米,不满足 GB 50229-2019 第 5.3.2 条要求的 3.5 米,问题点位已高亮。」

场景推演与风险分析问:「贵州山区的这个变电站,遇到 50 年一遇暴雨时的内涝风险点有哪些?」模型融合地理高程数据、当地水文资料、站内排水设施布局,模拟汇水路径,输出风险点位分布图、预计积水深度,以及应对建议(如「建议在东南角增设排水沟」)。

增量迭代更新后续如果有新的多模态数据进来(比如无人机补拍的照片、新的地质勘查报告),模型可以动态更新三维模型的几何结构和语义信息,无需从头重建。

数据飞轮:越落地,越智能

这套大模型并非实验室里的「演示品」。它已经在江行智能服务的 400+变电站、600+新能源场站、数十家煤矿与化工厂中实际运行。每天有超过 10 万小时的实时生产数据回流到训练平台,构建行业稀缺的高质量数据飞轮,形成「数据采集-模型迭代-能力下发」的飞轮。

尤其在工业场景中,真实物理数据极其稀缺——互联网上找不到变电站设备故障的红外热像序列,也找不到合闸操作的力觉反馈数据。江行智能凭借七年的现场深耕,构建了业内领先的「真实场景数据+真机操作数据+世界模型仿真数据」三维融合数据底座。这正是其多模态空间大模型能够从「重建」进化出「生成」能力的根本原因:数据足够多,模型才敢「脑补」。

产业资本集体下注:技术已跑通商业闭环

2026 年 3 月,江行智能宣布完成数亿元 B++轮融资,由朝希资本领投,宁德时代旗下晨道资本、晶科能源、山东能源集团兖矿资本、厦门建发新兴投资共同参与,老股东卓源亚洲持续加注。值得注意的是,多家投资方在决策前专程赶赴多个省份,实地勘查风电场、变电站——他们亲眼看到了机器狗在无人值守站内自主巡检,看到了 AI 在三维地图上推演内涝风险。

朝希资本合伙人汪彬评价:「江行智能引领真正『活在』工业场景的物理 AI,让工业机器人从『大白』进化为『师傅』。」晶科能源控股投资总经理杜威则表示:「其领先的边云协同架构与『AI 大脑+机器人』融合方案,已在真实工业场景中验证了规模化落地能力。」

不止于能源:一张可迁移的工业大脑

多模态空间大模型的能力,天然具备跨行业复制的属性。矿山需要巷道三维重建与瓦斯扩散推演,化工园区需要危险品泄漏路径模拟,轨道交通需要隧道结构病害识别——这些场景的底层逻辑,与变电站空间智能完全一致。

目前,江行智能已将技术拓展至数十家煤矿、油田、钢铁厂、化工厂,以及数百公里天然气管网。公司创始人、CEO 庞海天(清华本硕博,93 年出生)表示:未来 3-5 年,江行智能将快速拓展至矿山、化工、轨交等高价值工业赛道,最终打造覆盖物理世界的工业大脑基础设施。

当英伟达黄仁勋宣告「物理 AI 的 ChatGPT 时刻即将到来」,真正决定胜负的,不是谁的人形机器人跳舞更流畅,而是谁的 AI 能真正理解复杂、危险、零容错的工业物理世界。江行智能的多模态空间大模型,给出了一个从「看懂」到「脑补」再到「推理」的完整答案。而数亿融资与 5 亿年订单证明:这条路,已经跑通了。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。