当具身智能的「大脑」集体卡壳，她带着因果AI走到了台前

专注于因果世界模型（Causal World Model）的人工智能公司Aether AI正式宣布完成首轮融资，募集资金总额约2000万美元，由经纬创投领投，英诺基金、SWC Global、九合创投等机构联合参投。一位深耕因果AI十二年的UCSD教授，在VLA路线集体碰壁的2026年创办这家公司。这篇文章帮你理解：为什么「让机器懂因果」可能是具身智能走出实验室的关键钥匙。

耳机没电了，周围是地铁站地下空间来来往往的人流，黄碧薇博士（Prof. Biwei Huang），加州大学圣地亚哥分校（UCSD）助理教授、Aether AI创始人兼CEO，站着把笔记本电脑举在面前，对着屏幕大声讲话。电话那头是英诺基金的投资人王晟。两人此前只在微信上简单聊过几句，这是第一次非正式见面。

按照常规的融资叙事，这个场景不该出现在一笔交易的起点。但它确实发生了——王晟听完之后决定深入跟进。此后经过多轮尽调和沟通，经纬创投领投、英诺基金、SWC Global、九合创投等机构联合参投的首轮融资正式关闭，募集资金总额约2000万美元。

一个问题自然浮出来：是什么让一位纯学术背景的创始人，在如此「不专业」的场景下依然能引起顶级VC的兴趣？

答案藏在黄碧薇讲的那件事本身里。

一条从图灵奖开始的学术谱系

要理解她为什么能在地铁站里讲出让投资人兴奋的东西，得先看她背后站着谁。

因果推理这个学术领域有一条清晰的传承线。最上游是Judea Pearl——2011年图灵奖得主，因果推理数学框架的创立者。第一代推动者包括Bernhard Schölkopf（马普智能系统研究所所长）、Clark Glymour和Peter Spirtes——他们是因果发现领域的开山鼻祖，1989年提出的PC算法奠定了整个因果发现领域的基石。第二代的代表人物是Kun Zhang，他把因果发现从可观测变量推进到了隐变量场景。

黄碧薇是这条谱系里的第三代。她的学术积累横跨三大洲：先在德国马普智能系统研究所从事计算神经科学研究，随后进入因果发现研究的开创地——卡内基梅隆大学（CMU），师从该领域的开山鼻祖Clark Glymour教授和Peter Spirtes教授，在因果发现的源头接受了最系统的学术训练。之后她在加州大学圣地亚哥分校（UCSD）建立自己的实验室并任助理教授，完成了12年的学术积累，在NeurIPS、ICML、ICLR、CVPR等顶级会议上发表论文超过100篇，获得过Apple Scholar。

更关键的是——她主导开发了Causal-Learn。这一工具如今已成为全球因果发现领域使用最广泛的开源框架之一，也是她从学术积累走向产业实践的底层技术基础。在因果AI这个细分领域，黄碧薇不只是一个优秀的研究者，她是基础设施的建造者。全世界做因果发现研究的人，大概率用过她写的代码。Causal-Learn凝结了她在因果发现领域十余年的技术积累，也是她敢于从学术圈跨入产业界的底气之一。

但学术做得好的人很多，为什么偏偏是她、偏偏是现在？

为什么是2026年这个时间点

黄碧薇自己把创业的触发归结为「内因与外因的共振」。

内因是她在学术上已经把因果发现的核心问题「解决得比较好了」——好到可以工程化的程度。Causal-Learn从一个学术工具演变为领域内广泛使用的开源框架，本身就说明底层理论已经成熟到可以被非专家使用。

外因则来自产业端的集体困境。过去三年，具身智能领域投入了巨额资金，VLA（视觉-语言-动作）模型被寄予厚望。但一个反复出现的尴尬是：模型在训练数据上表现惊艳，一部署到真实环境就频繁失败。

黄碧薇对这个现象有一个尖锐的诊断。用她自己的话说：「VLA路线可以在Video Demo上秀出非常好、非常impressive的结果，但一旦应用到实际任务中就fail了。桌子高了两厘米，它可能就做不了这个任务。」

她把这个现象归结为范式的根本缺陷：相关性不等于因果性。VLA模型学到的是像素层面的统计模式——它记住了「这个画面之后通常出现那个画面」，但它不理解「为什么」。油温升高导致蛋液凝固速度加快，这是因果关系；而模型只是记住了某个特定温度下蛋液的像素变化轨迹。一旦条件改变，记忆就失效了。

2026年上半年，这个判断开始在部分投资机构中获得共鸣。经纬创投合伙人童倜在谈到这笔投资时说：「仅依赖过去的数据模式、相关性学习，已难以满足下一代智能系统的需求。」英诺基金的判断更直接：「因果智能的观测、行动、反事实体系，在世界模型上的智能潜力远超当前的经验体系。」

需要指出的是，这还谈不上行业共识——经纬和英诺的判断仍然属于少数机构的早期押注。但它说明，至少有一部分嗅觉敏锐的资本已经开始为「后LLM范式」寻找答案。而黄碧薇恰好站在答案可能出现的位置上。

「结构化压缩」到底在解决什么问题

「压缩即智能」是AI圈常说的话。黄碧薇认为这不够精确——简单的压缩不一定产生智能。

她用一个例子解释自己在做的事：如果模型真正学会了鸡蛋打进热油锅的因果规律——锅的大小、油温、蛋液状态之间的结构关系——那么即使改变油温、换一口锅，模型也能准确预测结果。这就是「结构化压缩」：提取背后的因果变量和动力学方程，而非记住所有像素轨迹。

与之对比，当前主流的大模型做的是「简单压缩」——用海量参数记住海量数据中的统计规律。这在自然语言任务上效果极好，因为语言本身就是人类已经归纳好的浅层信息。但在物理世界里，变量之间的关系远比语言复杂，简单压缩的效率急剧下降。

黄碧薇把AI范式的演进画成一个2×2矩阵：横轴是模型规模（小→大），纵轴是抽象能力（浅层相关性→深层因果机制）。90年代的机器学习是小模型+浅层相关性；2010年前后她的导师们推动了小模型+因果结构；2022年的LLM是大模型+相关性；而她要做的第四象限，是大模型+因果机制。

Aether AI的技术架构分四层：因果Transformer层（在可扩展架构上引入词元级因果建模）、模块化架构层（功能解耦）、因果世界模型层（从像素到因果变量识别与动力学建模）、智能体系统层（因果驱动的规划与归因）。黄碧薇强调这是在现有Transformer架构上「平滑过渡，逐步加入因果体系」。

早期验证给出了一个引人注目的数字：约50条高质量因果标注数据，就能让此前频繁失败的操作任务达到可靠的成功率，数据效率提升20%-30%。需要指出的是，这一数据来自创始人的陈述，具体的实验任务类型、对比基线和测试环境尚未公开披露，第三方尚无法独立验证其适用边界。

但即便保守来看，这个方向的逻辑是清晰的：如果因果建模能大幅降低对遥操数据的依赖，那它就直接击中了具身智能商业化的核心瓶颈。遥操数据的采集成本极高——你不可能让机器人反复摔坏杯子来学习「掉落」这个概念。Aether AI的策略是80%来自模拟数据和公开视频，只有20%用遥操数据做最后一公里适配。

一个学者型创始人的决策逻辑

黄碧薇选择投资人的标准很有意思：不看估值，看两件事——投资人是否真正理解并相信因果AI方向，以及能否提供产业资源。

这个优先级排序透露了她对公司阶段的判断。Aether AI现在需要的是「认知对齐」的合作伙伴。一家做全新范式的公司，如果投资人不理解你在做什么，后续每一次战略讨论都会变成科普课。

资金使用的优先级同样反映了学者型创始人的特征：人才第一，算力和数据基础设施第二，市场拓展最后。黄碧薇的逻辑是：因果世界模型是一个需要极深学术功底的方向，没有对的人，再多算力也没用。

她的团队构成印证了这一点。技术合伙人周博士在大模型训练领域有开创性工作，另一位技术合伙人冯博士在因果世界模型和因果强化学习领域耕耘了六七年。黄碧薇说团队成员愿意聚集的原因是：「大家觉得我们在做的事情是独一无二的，没有任何一个团队可以取代。」

这句话放在因果AI这个极度垂直的领域里，有一定的事实基础。全世界同时具备因果发现理论深度、大模型工程化能力、且处于创业年龄窗口的团队，确实屈指可数。

从实验室到机器人工厂还有多远

黄碧薇给出了明确的目标里程碑：2027年初，在机器人操作任务上达到「GPT-3时刻」——多种任务具备较好的泛化能力、高成功率并能执行长程任务；2027年下半年，结合移动与操作，在开放环境中实现自主探索与终身学习。

这是一个雄心勃勃的时间表。GPT-3在2020年发布时，让人们第一次意识到语言模型可以做远超预期的事情——但它距离真正的商业化落地（ChatGPT的发布）还有两年半。黄碧薇所说的「机器人GPT-3时刻」，更可能是一个能力证明的节点，而非商业化的起点。

她选择具身智能作为首个落地场景的理由有三层：物理世界需要能干活的机器人；具身智能的范式远未统一，做增量和定标准的空间最大；具身智能的数据相对干净，验证因果模型有效性的成本低——做一个抓取任务，成功与否一目了然。

与市场上其他世界模型路线相比，Aether AI的定位有明确的差异化。李飞飞团队的空间智能侧重3D结构渲染，杨立昆的JEPA侧重去除像素噪声、保留隐空间语义，而Aether AI的核心是显式地学习因果变量、因果结构和因果动力学。这三条路线并非互斥，但切入点和技术假设不同。

黄碧薇说过一句话：「LLM这条路线是OpenAI开创的，我们要开创的是以因果智能为核心的下一代AI范式。」

这是一个极大的宣言。但如果你回看她的学术谱系——从Judea Pearl的数学框架，到Glymour和Spirtes在1989年用PC算法奠定因果发现的基石，到Kun Zhang的隐变量突破，再到她自己主导开发的Causal-Learn成为全球因果发现领域使用最广泛的开源框架之一——这条线索确实指向一个结论：如果因果AI要产业化，她可能是当下最有资格尝试的人之一。

至于这个尝试最终能走多远，2027年初会给出第一个答案。

一条从图灵奖开始的学术谱系

为什么是2026年这个时间点

「结构化压缩」到底在解决什么问题

一个学者型创始人的决策逻辑

从实验室到机器人工厂还有多远

最新文章