腾讯云智算全面升级,AI 原生云基础设施迈向主动服务新时代

摘要

9 月 17 日,腾讯全球数字生态大会 Agent + Infra 专场聚焦「智能体驱动云基础设施跃进升级」这一主题,汇聚众多行业领军者,共同探索 AI 时代基础设施的技术突破与产业实践。

9 月 17 日,腾讯全球数字生态大会 Agent + Infra 专场聚焦「智能体驱动云基础设施跃进升级」这一主题,汇聚众多行业领军者,共同探索 AI 时代基础设施的技术突破与产业实践。腾讯云智算各产品负责人及行业客户深入解读 AI 原生云架构、主动服务型基础设施、全链路安全体系等核心议题,同时发布多项重磅成果,为智能体规模化落地筑牢技术底座。

在论坛中,腾讯云副总裁李力正式宣布,腾讯云智算面向「更贴近 Agent 的 AI Infra」重磅升级。腾讯云建立包括 Agent Infra 解决方案+Cloud Mate 云专家服务智能体与全链路安全能力为一体的完整解决方案,帮助 Agentic AI 从「实验室」走向「生产级」。

李力表示,未来两年,部署 Agent 的企业将翻倍,GenAI 相关的 IaaS 支出增速将达到 192%。随着 Agent 数量爆发式增长,企业对云计算基础设施的需求,将会快速从「资源供给」升级为「业务价值」,AI Infra 基础设施必须具备更快的推理效率、更灵活的工具集成、更可靠的系统保障和更自动化的服务能力。腾讯云智算体系核心优势在于「同源同构」,无需打造 AI 专属存储等设施,依托过往打磨的云原生能力,即可承接智算需求,实现云与智算能力的深度协同。目前,腾讯云智算已实现「一云多芯」软硬协同,支持公有云、专有云、边缘环境的同源同构部署,为交通、制造、具身智能等行业提供从模型训练到推理落地的全链路支撑。

图:腾讯云智算能力升级,成为更贴近 Agent 的 AI 原生云

在 AI Infra 底座层面,腾讯云智算基于在云计算、分布式存储、高性能网络等基础设施方面的深厚积累和场景优化,大幅提升云上资源的性能和利用率,最终实现降本增效。模型启动提速 17 倍,大规模服务扩容时间从 10 分钟缩短至 34 秒;多模态推理加速 4 倍,自研推理引擎覆盖生文、生图、生视频等模型;通过内存优化与通讯协议升级等创新,显著降低计算开销,推动推理集群的性能发挥到极致。

智能体要从「实验室」走向「生产级」,工程问题和安全问题将成为核心痛点。全新发布 Agent infra 解决方案 Agent Runtime,集成运行引擎、云沙箱、上下文服务、网关、安全可观测五大组件,为智能体提供坚实基础设施,其中云沙箱实现毫秒级启动,数十万实例秒并发。

全新发布的 Cloud Mate 云专家服务智能体,将专家经验转化为自动化服务,利用 Agent 的自动化编排能力,在云上架构治理、风险 SQL 拦截、故障定位等场景大幅提升效率,打造能主动服务的云。目前已为客户提供超百万次智能架构治理服务,在内部实践中,风险 SQL 拦截率 95%,排障效率从 30 小时降低至最快 3 分钟。

在安全层面,腾讯云通过一整套大模型与智能体安全治理框架,为云上客户提供安全、可控、可靠、满足监管要求的安全建设思路。方案贯穿模型选型、模型训练、推理部署、业务应用全流程,实现边界 API 与用户输入/输出安全、模型运行环境安全防护及态势管理、智能体与 MCP 身份和特权防护、智能体行为与意图安全管控、数据安全全流程安全等。

此外,李力还分享了从数字世界到现实世界的思考。机器人是 AI 影响现实世界的一个关键形态,但具身智能与大语言模型存在显著数据差异:一方面是具身的数据采集难度比较大,包括视觉、环境、关节角状态等数据均要采集;另一方面,采集的数据与硬件高度绑定,进一步增加了数据采集的门槛。因此,腾讯云希望能够帮助客户跳过数采、训练环节、直接提供支持跨本体直接使用的具身模型非常重要。腾讯云智算联合 Tairos(钛螺丝)提供了感知和规划模型服务,通过 HAI 推理集群获取专属的机器人云上大脑。

Agent + Infra 专场上,IDC 与腾讯云联合发布了《AI Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告深度剖析生成式 AI(Gen AI)规模化落地背景下,AI Infra(AI 云基础设施)从基础算力平台向核心智算基础设施的演进路径,系统梳理其技术架构、核心能力与行业适配方案。报告纳入了地平线、货拉拉、一汽丰田、燧原科技、作业帮、考试宝、心言集团、尚航科技、元石科技、智诊科技、德适生物等标杆企业,覆盖交通出行、工业制造、教育培训、泛互联网、具身智能、智慧医疗等六大重点行业,为企业智能化转型提供「技术-场景-价值」三位一体的行动指南。

在专场中,腾讯云多家客户及伙伴参会,作业帮、帕西尼感知科技、智诊科技、燧原科技等各行业代表企业,共同围绕 AI 时代基础设施的技术突破与产业实践进行深入分享。

作业帮针对教育场景算力供需的矛盾,搭建统一算力网络,通过 Docker+K8s 容器调度、跨区域云联网、GPU 共享(qGPU)、在离线混部等策略,解决算力不足难题,节省算力成本。通过腾讯云 COS 优化模型分发,全链路耗时从 6 小时缩至 45 分钟。同时,借助 Agent、MCP 协议与向量数据库,将基础服务接入效率提升 10 倍,构建起教育行业 AI 与基础设施协同的高效范式。

帕西尼通过带有稀缺触觉模态的亿级全模态具身智能数据,助力 AI 理解现实物理世界。依托全球首座全模态超级数据采集工厂,年产能近 2 亿条全模态数据,构建包含触觉模态在内的高质量 OmniSharing DB 数据集,支撑具身智能大模型 OmniVTLA 研发。借助腾讯云 Data Platform 解决方案实现亿级全模态数据的存储和管理,海量数据通过迁移服务统一采集进入对象存储 COS,GooseFS 提升数据读写性能,加速模型训练效率,让数据自由流转;依托腾讯云算力对全模态数据深加工,可重定向至不同机器人本体;腾讯云 TAIROS 具身智能开放平台提供完整工具链,将仿真、云服务与前沿具身智能模型快速对接数据和本体,推动全模态数据集 OmniSharing DB 赋能具身智能快速落地。

智诊科技,希望基于海量的算力、极致的通信效率和海量数据的高速读取,训练一个能实现「主动式关怀」的医疗大模型,破解医疗成本/医疗效果/医疗可及性这一全球医疗健康的「不可能三角」。其自主研发的千亿参数多模态大模型 WiseDiag-Z1,通过腾讯云稳定高效弹性的训推集群、星脉网络(为 GPU 集群铺设无拥堵超级高速路)、CFS Turbo(为数据供给打造数据仓库),学习超 3 万亿专业医疗 tokens(含 19 万篇论文、50 万真实病例),在 MedBench 评测中多次登顶中文医疗 AI 榜首。

燧原科技以国产算力为核心,联合腾讯专有云 TCE 打造以 AI 为核心的智算云数据中心,围绕 GPU 构建高性能网络、存储、云平台、算力与模型 MaaS 平台及安全平台,全面满足模型训练、推理等智算场景需求。燧原科技首创「互联网推理+城市推理」双算力池模式,成为全国首个获全满分认证的国产超大规模推理集群。其新一代推理加速卡性能较上一代提升 2 倍+,性价比超旗舰 GPU1.5 倍+,通过腾讯专有云实现异构算力统一纳管、租户隔离与弹性扩缩容——支持 1200+算力节点分钟级扩缩容、业务迁移秒级完成,4 天内即可完成万卡规模部署。

腾讯云通过 AI Infra 的技术革新,推动云计算从「资源时代」迈向「智能服务时代」。正如腾讯云副总裁沙开波所言:「未来的云计算基础设施将具备自感知、自决策、自优化的能力,而腾讯云愿与伙伴共同加速这一进程。」

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。