
9 月 16 日-17 日,2025 腾讯全球数字生态大会在深圳召开。
9 月 16 日-17 日,2025 腾讯全球数字生态大会在深圳召开。在 9 月 17 日举办的 Infra Agent 专场中,腾讯云与全球领先的信息技术研究与顾问公司 IDC 联合发布《AI Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告(以下简称「报告」)。报告深度剖析生成式 AI(Gen AI)在规模化落地背景下,AIInfra(AI 云基础设施)从基础算力平台向核心智算基础设施的演进路径,系统梳理其技术架构、核心能力与行业适配方案,并结合腾讯云在互联网、交通出行、工业制造、医疗、教育等领域的实践案例,为企业基于 AI 深化智能化转型提供「技术-场景-价值」三位一体的行动指南。
报告中,腾讯云与 IDC 共同指出,随着 AI 应用从技术验证迈向规模化落地,企业对云智算设施的需求已从「单纯算力供给」升级为「全链路业务赋能」,AI Infra(AI 云基础设施)正成为驱动产业数智化转型的关键基础设施。
其核心特征可概括为四大维度:
一、分布式底座:支持混合云架构下的云边一体算力布局,实现 AI 模型与应用全流程管理;
二、异构硬件:融合 GPU/TPU/DCU 等多元智算芯片、高性能存储与智能网络,构建统一纳管的异构计算资源池;
三、高性能软件:通过异构计算、存储与网络组件,最大化释放硬件性能,支撑模型训推全链路效率提升;
四、场景化方案:针对模型训练/微调、推理优化、智能体(AI Agent)开发等需求,提供模板化行业解决方案。
六大演进趋势:AI 原生云重塑智算基础设施逻辑
报告结合产业实践提出,AI Infra(AI 云基础设施)正加速向架构重构、行业垂直化、算力智能化、安全能力提升、研发范式革新、服务化转型六大方向突破,其中 AIAgent 的崛起成为关键驱动力。
架构重构:从「云+AI」到「云原生+Agent 协同」。核心在于构建分布式训推一体化架构。通过新一代的智算基础设施,实现 GPU/TPU 等异构算力池化,支撑微秒级延迟的实时推理网络与 Agent 长周期上下文保持,同时支持多 Agent 协同工作,满足复杂业务决策需求。例如,在智能驾驶场景中,云边端协同的算力架构可实现车路协同数据的实时处理与决策。
行业垂直化:以 Agent 为载体的场景化交付。推动行业 Know-how 与云原生技术深度融合,提供「开箱即用」的解决方案——如金融领域的智能风控 Agent、医疗领域的 AI 诊疗 Agent,可自动调用行业知识库与多模态交互能力(语音/视觉/文本),大幅降低企业应用门槛。
算力智能化:全局资源优化配置。实现异构算力统一纳管与智能调度,通过算力标签体系、性能预测模型动态匹配业务峰谷需求,同时支持边缘 Agent 轻量化部署,提升算力利用率。例如,腾讯云算力调度平台可将 GPU 使用率提升 80% 以上。
安全能力提升:构建可信立体防护体系。覆盖数据全生命周期安全(字段级加密、动态脱敏)、模型安全(对抗训练、水印溯源)与合规认证(等保 2.0、GDPR 适配),同时引入区块链存证 Agent 决策链、伦理规则代码化植入,防范 AI 诱导泄露风险。
研发范式革新:标准化 AI 研发体系。以 MLOps(机器学习全生命周期管理)、AIOps(智能运维)、自动化模型训推、AgentOps(Agent 行为审计与协作效能评估)为核心,构建自动化模型训推流水线与版本控制体系,缩短 AI 应用迭代周期。
服务化转型:AI 能力普惠化。将 AI 能力拆解为模块化、Serverless 化服务,通过 API 市场与按需付费模式降低使用成本,同时提供低代码/无代码开发平台,推动 AI 技术平权。例如,腾讯云 HAI(高性能应用服务)可一键部署混元、DeepSeek 等 20+主流模型,大幅简化开发流程。
千行百业实践:腾讯云智算落地案例解析
在白皮书中,首次全面详实解析了 AI Infra(AI 云基础设施)在多个重点行业中的行业适配与深耕。报告纳入了地平线、货拉拉、一汽丰田、燧原科技、作业帮、考试宝、心言集团、尚航科技、元石科技、智诊科技、德适生物等标杆企业,覆盖交通出行、工业制造、教育培训、泛互联网、具身智能、智慧医疗等六大重点行业。
在交通出行领域,地平线借助 200Gbps vRDMA 加速网络,将自动驾驶训练集群性能提升 25%,千卡扩展比达 92%;某头部新势力车企通过 COS 与 GooseFS 构建的数据闭环,实现百 PB 级存储成本降低 40%,模型训练效率提升 30%。工业制造场景中,燧原科技在庆阳部署的国产异构智算中心,以「超大规模云平台+国产化 GPU」模式成为「东数西算」示范;某知名手机厂商依托 GooseFS 存储加速,将大模型分发效率提升 3 倍,服务稳定性提高 57%。
教育培训行业,作业帮通过向量数据库与 GPU 共享技术,实现 AI 问答响应提速 5 倍,成本降低 30%;考试宝则基于向量检索将试题聚类准确率从 50% 提升至 95%,覆盖 8000 万用户。
泛互联网领域,心言集团借助 TKE 容器与星脉网络,支撑千万级用户高并发访问,成本节约 20%;元石科技通过跨国数据传输方案,数据爬取效率提升 100 倍,合规拦截率超 95%。
具身智能与医疗领域同样成果显著:某科研单位构建的多模态训练平台,使机器人训练效率提升 200%;智诊科技「好伴 AI」依托腾讯云算力打造的医疗大模型,实现 500 名专家「数字分身」规模化落地,基层健康服务响应提速 3 倍;德适生物 iMedImage™通过 HCC 集群部署,模型推理吞吐翻倍,覆盖 90% 临床影像场景。
结语:
随着 GenAI 与 AIAgent 的深度融合,AI 将进一步突破「技术-场景-合规」的协同瓶颈:在技术层面,多模态融合与具身智能将成为核心方向;在场景层面,从「单点效率提升」转向「全业务流程重构」;在合规层面,动态安全评估与伦理约束将嵌入技术全周期。
据悉,该报告已同步在腾讯云官网、IDC 中国官网上线,可为互联网企业服务、交通出行、教育、医疗、工业制造等行业提供可落地的智算转型参考方案。
来源:互联网