
2025 年春节期间,当 DeepSeek 模型引发行业热烈讨论之时,沐曦股份的技术团队就已经完成了该模型在自研 GPU 上的适配调试。这份抢先一步的成果,并非偶然的运气,而是团队长期坚持「技术预见」、主动探索的结果。一个小小的模型适配细节,背后折射出一家国产 GPU 企业敏锐的行业嗅觉、扎实的技术功底与敢闯敢拼的团队底色。

本报记者 赵奕 上海报道
2025 年春节期间,当 DeepSeek 模型引发行业热烈讨论之时,沐曦股份的技术团队就已经完成了该模型在自研 GPU 上的适配调试。这份抢先一步的成果,并非偶然的运气,而是团队长期坚持「技术预见」、主动探索的结果。一个小小的模型适配细节,背后折射出一家国产 GPU 企业敏锐的行业嗅觉、扎实的技术功底与敢闯敢拼的团队底色。
如今,人工智能、生成式应用、数字孪生广泛赋能千行百业,算力成为支撑新质生产力的核心底座。全球 GPU 市场长期由海外巨头主导,技术壁垒、生态鸿沟横亘在国产厂商面前,行业竞争也早已告别单纯比拼硬件参数的阶段,开发者生态、场景服务的综合实力,成为决胜关键。在这样的产业背景下,《华夏时报》启动未来企业竞争力调研行,首站走进沐曦集成电路(上海)股份有限公司。这家 2025 年 12 月登陆科创板的硬科技企业,坚持全栈自研路线,从底层芯片核心 IP 到软件生态稳步深耕。我们透过一个个研发、攻坚、坚守的真实故事,解码沐曦股份的核心竞争力,也以此窥探国产算力产业的突围方向与未来潜能。

用沐曦股份高级副总裁孙国梁的话来说,一块高性能 GPU 芯片,从最初的架构勾勒,到反复调试,再到流片,往往要历经上万次测试打磨,漫长的研发之路考验着每一位从业者的耐心与坚守。沐曦股份多年来始终沉心深耕,在国产高性能 GPU 这条长赛道上稳步前行,用一步步的突破回应市场与行业的期待。
自研攻坚,突破技术高墙
「沐曦从创业之初就定下全栈自研的发展方向,不依赖外部现成技术与 IP,坚持从底层架构开始打磨每一项核心技术,这也成为企业安身立命的根本。」沐曦股份高级副总裁孙国梁说道。依托这份执着的研发精神,沐曦股份凭借多年深耕,如今已搭建起四大成熟的 GPU 产品序列,形成覆盖全算力场景的完整矩阵。曦云 C 系列主打训推一体,聚焦 AI 大模型训练、通用计算等场景;曦思 N 系列专攻推理,适配智慧城市、生成式 AI 等领域;曦彩 G 系列聚焦图形赛道,服务云游戏、数字孪生等应用;2026 年 1 月推出的曦索 X 系列,则针对材料科学、生命科学、生物制药等高端科研场景优化,补齐了科学智能场景的算力布局。四个产品序列全面覆盖当下主流算力需求。
对于沐曦股份来说,2025 年不仅是登陆资本市场的重要节点,也是其产品迭代与供应链建设的关键一年。这一年,沐曦股份推出的曦云 C600 系列,不仅算力相比上代产品大幅提升,更重要的是首次实现了全国产供应链工艺落地。该产品于 2025 年年末进入风险量产,目前已实现了量产销售,正式推向市场。全国产化方案也让企业彻底提升了供应链自主把控能力。
持续的研发投入,是技术突破最坚实的后盾。根据 2025 年年报数据,沐曦股份全年研发投入达 10.27 亿元,研发投入占营业收入比例高达 62.49%。持续投入催生出一系列硬核成果:企业自研的 MetaXLink 高速互连技术,单颗芯片集成 7 个专用接口,带宽性能对标国际旗舰产品,可支持 2 卡至 128 卡集群互连,兼顾小型任务与超大规模大模型训练。同时企业自主研发的 MXMACA 指令集包含 600 条计算指令与 800 条渲染指令,实现安全可控的全流程技术覆盖。截至 2026 年 4 月底,公司共拥有 530 多项国家专利、软件著作权、集成电路布图设计、商标等知识产权,技术储备稳居国内 GPU 行业第一梯队。
在孙国梁看来,AI 大模型算法迭代速度飞快,GPU 行业永远没有「一劳永逸」的技术。为此企业始终遵循「量产一代、在研一代、规划一代」的研发思路,「量产一代」稳固市场,「在研一代」跟进需求,「规划一代」前瞻布局,支撑长期竞争力与市场份额提升。他也客观坦言,国产 GPU 与国际顶尖产品仍存在差距,但脚踏实地坚持全栈自研,才是本土企业长久发展的必经之路。
生态出圈,加速商业化
如果说硬件芯片是算力的「骨架」,软件生态就是激活硬件价值的「血肉」。拥有国内稀缺的全建制团队、核心团队拥有 20 年以上行业经验的沐曦股份,早已洞悉软硬件并举的必要性并付诸行动,而这份前瞻布局,也在一次次大模型适配、技术攻坚中落地见效。
研发人员张瑞(化名)所在的团队,早已把「跟踪新发大模型、上机测试适配」变成了日常工作习惯。2025 年 DeepSeek 模型刚刚问世之际,团队便凭借多年的技术积累和行业敏感度,启动适配工作,在春节假期前就完成了模型在沐曦 GPU 上的稳定运行。当该模型成为行业热点时,沐曦股份早已抢先完成布局。而当行业转向千亿 MOE 模型,分布式推理成为行业难题时,张瑞再次扛起攻坚重任。此时的他不再只是单纯的技术执行者,而是团队的「路线规划者」。他坚持深入一线代码与实验,亲自验证每一条技术路径,再将复杂的攻坚目标拆解为清晰的任务,协调跨团队工程师协同作战。团队同步对接 MXMACA 开源社区,结合硬件特性做创新改造。历时近五个月的连续攻坚,团队成功搭建起全新分布式推理系统,相比原有方案,单卡性能实现五倍跃升。
从快速适配热门大模型,到攻坚分布式推理技术,一个个案例印证了沐曦股份在软件领域的深厚实力。这也是沐曦股份的核心优势。当前,国内不少厂商陷入「重硬件、轻软件」的误区,仅做基础软件适配、采用闭源模式,最终形成生态孤岛。而沐曦股份从创业初期就将软件生态置于同等战略高度,坚持硬件、软件双轮并行。
MXMACA 软件栈是沐曦生态体系的核心载体。这套自研软件工具链原生兼容国际主流生态,开发者无需大幅改写代码,就能完成适配、应用迁移,极大降低使用门槛。2025 年 2 月,沐曦股份正式上线开源社区,以开放姿态拥抱全行业开发者。截至 2026 年 5 月,MXMACA 软件栈注册的开发者用户已近 50 万人,网络 API 调用次数超 5591 万次,文件下载量突破 16 万次。目前软件已适配 6000 余个主流应用、1000 多款大模型,针对 Qwen3.5、智谱 GLM 等超 25 款标杆模型完成「Day0 适配」——实现模型上线即适配。作为国内少数开放核心软件、公开 SDK 并配套中英文文档的 GPU 企业,沐曦股份目前已累计发布 30 余个开源项目、分享 500 余份开发手册。
沐曦股份联合创始人、CTO 兼首席硬件架构师彭莉近日登上央视《对话》栏目透露,公司 2026 年计划完成现有软件 80%—90% 的开源工作,MXMACA 软件栈届时将全面开源,开发者社区也将冲击 100 万人的规模大关。在她看来,开源相当于统一度量衡和语言,「大家都用沐曦 MXMACA 生态,这会成为我们最大的护城河。」
不仅面向行业开发者,沐曦股份还将 MXMACA 引入国内半数以上 C9 高校,从人才源头培育新生代算力开发者,为生态长期发展积蓄力量。针对全新的曦索 X 系列科学计算 GPU,技术团队也完成了专项软件优化,可稳定支撑基因分析、材料模拟等数十个科学智能科研场景,实现软硬件的深度适配。孙国梁表示,软件生态的建设是一场长期工程,只有保持开放姿态,吸引更多开发者参与,硬件产品的价值才能真正释放,国产算力的生态才能快速繁荣。
软硬件的深度协同,推动企业营收结构不断丰富。2025 年,沐曦股份实现营业收入 16.44 亿元,同比增长 121.26%。从业务结构来看,GPU 板卡及配件等硬件产品是营收基本盘,全年收入 16.31 亿元。细分产品的销量数据,更能直观体现市场认可度:训推一体 GPU 板卡销量同比增长 147.31%,智算推理 GPU 板卡销量同比飙升 866.02%。截至 2025 年末,公司 GPU 产品累计出货量突破 55000 颗,产品陆续落地国内十余个智算集群,算力网络覆盖北京、上海、杭州、长沙等多个地区。而 IP 授权、技术服务业务同步发力,全年营收 1333.90 万元,同比增长 59.59%,该板块毛利率高达 98.22%,高附加值特征凸显,印证了自研 GPU 底层知识产权对外商业化的长期潜力。孙国梁分析,当下算力需求不再局限于单一训练场景,云、边、端融合成为行业主流,沐曦股份多元化的产品与生态布局,恰好能匹配不同场景的差异化需求。
随着产品出货量持续增加、应用场景不断拓宽,叠加软件服务业务稳步增长,规模效应将逐步显现,企业盈利的窗口期也在不断拉近。
人才聚力,激活科创动能
GPU 行业的竞争,终究是人才与匠心的比拼。从顶层架构研发,到软件生态搭建,再到产线质量把控,每一个环节都离不开坚守岗位的从业者。在沐曦股份的芯片量产测试环节,李玲(化名)和搭档朱晓(化名)就经历了一场长达两个月的「破案之旅」。
量产阶段,产线出现一个棘手问题:部分芯片测试结果显示合格,但对应的测试日志却莫名丢失。实验室小批量测试从未出现异常,一旦进入工厂大规模生产,数据就随机「失踪」。两人尝试延长保存时间、增加数据刷新等多种常规办法,一次次满怀希望进厂调试,又一次次迎来失败。在反复尝试无果后,她们放弃实验室推演,穿上防静电服,守在工业机台旁,紧盯数据流。无数个日夜的蹲守后,一行一闪而过的「路径连接失败」提示被捕捉,众人终于找到根源:工厂复杂电磁环境造成毫秒级连接闪断,进而导致数据丢失。找到问题后,团队新增心跳检查与自动重连机制,更换抗干扰传输线,彻底根除了这一隐患。两个月、上百次尝试,这份较真与坚守,正是沐曦一线员工的真实写照。
这份扎根细节、精益求精的态度,贯穿于企业整个团队。截至 2025 年末,沐曦股份全体员工共 925 人,其中研发人员 675 名,占比达到 73%。创始团队拥有二十年左右的 GPU 设计与量产经验,核心骨干均具备行业头部企业从业背景。公司内部没有严苛的部门壁垒,硬件、软件、算法工程师可以联合攻坚;面对创新试错,企业始终保持包容态度,鼓励团队大胆探索。日常的技术分享会、老带新的交流模式,也让团队形成了互帮互学的良好氛围。不少员工坦言,投身国产 GPU 事业,早已不只是一份工作,更是一份共同的理想。「胜则举杯相庆,败则拼死相救」——沐曦股份将这句话置于企业文化展览墙上,背后正是团队日常协作中彼此信任、互相支撑的真实写照。
除了宽松的研发氛围,沐曦股份搭建了完善的人才激励与培养体系。2025 年年报显示,公司 75.5% 的员工参与持股计划,将个人发展与企业发展深度绑定。同时企业建立全维度培训体系,覆盖新人培养、专业技能、管理能力等多个维度。面对全行业 GPU 人才缺口,沐曦股份还向清华大学、浙江大学等高校设立专项奖学金,联动学界培育集成电路后备人才。孙国梁表示,留住人才、培育人才,是企业和行业长久发展的核心。
完善的激励机制、包容的企业文化、志同道合的团队,多重优势叠加,让沐曦股份拥有穿越行业周期的底气。对于重研发、长周期的硬科技企业而言,技术可以迭代,产品可以更新,但一支有理想、有韧性、肯钻研的团队,才是最核心的无形资产。
站在 2026 年仲夏回望,沐曦股份在过去两年接连交出亮眼答卷:成功登陆科创板、完成曦云 C600 全国产化芯片的量产销售、营收实现翻倍增长、曦索 X 系列新品正式亮相,生态用户规模持续扩容。日前,沐曦股份正式宣布冲刺港股 IPO,开启资本市场新征程,彰显了企业加速全球化布局、深化技术研发的坚定决心。但公司也清醒地看到,GPU 行业投入大、周期长、国际巨头环伺的竞争格局未变,供应链自主化与经营效率仍需持续精进。
沐曦股份的成长故事,也是当下众多国产硬核科技企业的缩影。在国内算力需求持续释放、「东数西算」工程稳步推进的大背景下,本土 GPU 企业放弃短期捷径,选择全自研的长期路线,一步一个脚印向前奔跑。如今的算力竞争,早已不再是单颗芯片性能的比拼,而是硬件、软件、生态、供应链、场景服务的综合较量。从单一产品到全矩阵布局,从硬件突破到生态共建,从技术攻坚到产业联动,沐曦股份走出了一条属于自己的突围之路。我们期待像沐曦股份一样的科创企业继续稳步前行,用技术创新赋能千行百业,也相信越来越多的本土科技力量会成长壮大,共同构筑起坚实的国产算力体系,助力数字经济发展行稳致远。
来源:互联网



