华为云张宇昕:昇腾云服务基于 CloudMatrix384 引领 AI 算力进入超节点时代

摘要

今日,在华为全联接大会 2025 期间,以「AI 新引擎,重塑千行万业智能跃升」为主题的华为云 AI 峰会隆重召开。

今日,在华为全联接大会 2025 期间,以「AI 新引擎,重塑千行万业智能跃升」为主题的华为云 AI 峰会隆重召开。峰会汇聚超过 1000 位政界、商界及技术领域代表,探讨人工智能技术演进与产业落地进程。华为云 CTO 张宇昕发表「AI 新引擎,重塑千行万业智能跃升」主题演讲,向与会嘉宾介绍了华为云 AI 领域的新突破。

华为云 CTO 张宇昕发表主题演讲

华为云 CTO 张宇昕指出,Agentic AI 是一种全新的应用和计算形态,其对底层基础设施的动态性要求,较以往任何应用形态都更为苛刻且复杂,彻底重构了计算系统的交互逻辑与资源配置规则。「为了以优的性能』『好的服务』『高的质量,持续为客户打造更领先的云服务,华为云面向 Agentic AI 对云平台的核心需求,对技术堆栈展开全新规划与未来展望,形成覆盖 AI基础设施、大模型及工具链、Agent平台布局,旨在为企业的智能化升级提供更坚实的底层技术支撑」,张宇昕表示。

在 AI 基础设施方面,华为云昇腾 AI 云服务基于 CloudMatrix384 超节点,让通用计算、智能计算通过全新高速网络 MatrixLink 进行对等全互联,形成一个灵活实现算力配比的异构算力系统。支持专家并行推理的同时,显著降低了因并行通信传输造成的 NPU 空闲等待时间,结合一系列优化技术如模型量化、算子融合等一起,共同实现了单卡推理性能 4-5 倍的提升。此外,华为云推出以内存为中心的 AI-Native 智算存储。在 AI 推理场景中,基于超节点对等内存池化,历史 KV Cache 数据无需重复计算,将推理的首 Token 时延降低 90%

在大模型方面,华为云围绕行业场景,通过数据准备、高效增训、模型评测三个方面的工程创新,帮助客户训练出更高质量的行业大模型。以增训为例,华为云提供开箱即用的行业模型增训工作流,针对基础模型能力特性以及不同的行业增训目标场景,通过自动寻优数据配方、模型训练配方,可将模型增训效果提升 20%-30%。根据第三方咨询报告,目前华为云盘古大模型在制造、金融、政务、医疗、制药、汽车、气象等 7 个行业保持市场规模领先。

在 AI Agent 方面,为帮助企业高效构建满足企业生产系统要求的 Agent,华为云围绕 Agent 应用的全生命周期进行了端到端的产品设计,全面集成了华为云 AI 算力、模型、数据平台、工具调用及生态能力,打造企业级智能体平台 Versatile,覆盖开发、部署、发布、使用、运营等环节。

在端云协同方面,华为云通过统一的算力网络,可以针对客户的不同场景,提供跨云训练、跨云推理、云训边推等训推协同解决方案。不仅保护数据主权和数据隐私,而且能够实现训推资源的高效利用。该方案支持客户充分利用多站点的算力资源,并使跨站点训推场景的算力性能的损耗率 < 10%。

华为云聚焦 AI for Industry,致力于成为面向企业领域的最佳智能化云平台,成就每一个客户成为行业智能化先锋。华为云将和客户、伙伴、开发者一起,加速千行万业的智能化。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。