
摘要
深势科技与北京科学智能研究院、北京大学,推出全球首个通过自回归下一 token 预测统一 3D 结构生成与理解的科学大模型 Uni-3DAR。
深势科技与北京科学智能研究院、北京大学,推出全球首个通过自回归下一 token 预测统一 3D 结构生成与理解的科学大模型 Uni-3DAR。

Uni-3DAR 整体架构
该模型创新性地解决了 3D 建模领域数据表示割裂和任务建模孤立两大核心痛点:第一,数据表示不统一,第二,建模任务不统一。
为此,Uni-3DAR 提出同时创新构建两大核心技术:
1、Compressed Spatial Tokens 统一微观与宏观 3D 结构:Uni-3DAR 提出了一种层次化、由粗到细的 token 化方法,充分利用了 3D 结构固有的稀疏性,通过八叉树分解、精细 token 化与二级子树压缩,不仅大幅降低了数据表示的复杂度,而且实现了从微观到宏观 3D 结构的统一表示,为后续自回归生成与理解任务提供了高效、通用的数据基础。
2、Masked Next-Token Preiction 统一生成和理解的自回归框架:基于 Masked Next-Token Prediction,此设计使不同任务对应的 token 在模型内部彼此独立、互不干扰,从而支持联合训练。同时,自回归特性也便于将其他模态数据(例如自然语言文本、蛋白质序列、仪器信号等)统一到单个模型,进一步提升模型的泛化能力和实用性。
该框架首次将自回归范式引入 3D 建模领域,打破生成与理解的边界,并支持与文本、蛋白质序列等多模态数据融合。未来计划拓展至宏观力学(如气候模拟)、多模态科学模型开发(融合科学文献与实验数据),推动构建「物理世界通用语言」,加速药物设计、新能源材料等领域的颠覆性创新。



