
大模型应用在各行业落地, 大模型平台愈发火热, 但各项能力水平怎么衡量?
大模型应用在各行业落地, 大模型平台愈发火热, 但各项能力水平怎么衡量? 由中国信通院牵头, 依托中国人工智能产业发展联盟 (AIIA) 模型服务 (MaaS) 工作组, 联合 30 余家单位共同编制的《MaaS 模型即服务技术与应用要求 第 7 部分:大模型 API 服务性能测试方法》标准 (AIIA/T 0221-2025) 已正式发布。深信服作为核心参编, 共促 AI 技术应用的规范发展与创新。
《MaaS 模型即服务技术与应用要求 第 7 部分:大模型 API 服务性能测试方法》标准 (AIIA/T 0221-2025)
模型即服务 (MaaS) 已成为大模型应用落地的主要模式之一,MaaS 平台为用户提供便捷、灵活、低门槛的大模型服务, 是重要的支撑平台。但不同平台上所提供的大模型服务能力参差不齐, 中国信通院已发布一套全方位评估体系来衡量大模型 API 服务效能和 MaaS 平台能力, 即《MaaS 模型即服务技术与应用要求》。
本次深信服参与编制的文件为该标准的第 7 部分, 有效填补了大模型 API 服务性能评估标准的空白。该标准主要规范和明确了以下内容:
性能测试的软、硬件环境要求;
关键性能测试指标及计算方法, 多种测试类型及测试场景;
性能测试过程中的测试数据集选择原则和系统资源监控范围;
大模型 API 服务性能测试流程设计、数据集选择、性能指标计算方式和评价维度。
在本次标准编制过程中, 深信服凭借在大模型技术上的深入探索以及对私有化大模型算力平台构建的丰富实践经验, 为标准的科学性、实用性与前瞻性贡献了重要力量。
从安全 GPT 大模型到 AICP 算力平台的发布, 深信服长期布局 AI 产业, 已有深厚的 AI 能力积累。近期, 深信服还将整合技术能力, 升级 AI 创新平台, 打造新智算时代的 AI Infra 平台, 不仅为用户提供高性能、稳定、安全的平台能力, 更为用户实现端到端 AI 应用建设 TCO 优化, 让各行业用户以更轻松的方式拥抱 AI。
未来, 深信服会继续扎根 AI 技术研究, 积极参与标准建设, 参与建设更繁荣的生态, 为各行业落地大模型提供更有效的能力, 打造更健康的行业环境。
来源:互联网