
两款 AI 服务器新品惊艳亮相
8 月 18 日,中国算力大会在银川盛大开幕,在「智算无限 全栈智能联想 AI 算力战略暨 AI 服务器新品发布会」上,联想重磅发布两款全新 AI 服务器产品——联想问天 WA7780 G3 AI 大模型训练服务器和联想问天 WA5480 G3 AI 训推一体服务器。
这两款服务器是基于 AI 导向打造的全新产品,能够助力构建更加绿色高效的人工智能数据中心,满足客户从训练到推理等多样的算力需求。
AI 赋智,绿色赋能:打造AI 导向的算力基础设施,领跑中国智能化变革
近年来,在「建设数字中国」的背景下,中国算力基础设施的「地基」快速发展,行业智能化转型迎来进一步深化。与此同时,据 IDC 报告显示,随着生成式人工智能应用的爆发,各行业对智算的需求首次超过通用算力,AI 算力已成为算力发展的主要方向。
今年年初,联想发布了联想服务器的首个本地化品牌「联想问天」,以「本地创新、敏捷高效」为品牌内涵,更好地满足中国本土客户的个性化需求。联想通过 AI 导向的算力基础设施,加速人工智能进入千行百业、覆盖多元场景,最终实现普适、智慧相融合,引领算力行业走向普适、智慧和绿色的新未来。
会上,联想集团副总裁、联想中国区基础设施业务群服务器事业部总经理陈振宽表示:「在通用算力向 AI 算力发展的当下,联想问天 WA7780 G3 AI 大模型训练服务器和联想问天 WA5480 G3AI 训推一体服务器两款新品将分别满足不同类型的 AI 应用场景需求。」
联想问天 WA7780 G3 AI 大模型训练服务器:性能强劲,灵活高效
联想问天 WA7780 G3 是一款专为 AI 大模型训练所打造的服务器。AI 算力已成为企业训练开发使用人工智能的硬门槛。联想问天 WA7780 G3 AI 大模型训练服务器正是为打破 AI 算力供给困境而来,为训练提供强劲的算力支撑。
l 澎湃算力
联想问天 WA7780 G3 AI 大模型训练服务器基于第四代英特尔®至强®可扩展处理器。NVIDIA HGX H800 系统配备 8 颗 H800 NVLink®GPU,拥有高达 640GB 的 HBM3 高速显存,通过 NVLINK®, GPU 间互联带宽高达 400GB/s。将 AI 算力提升了 3.44 倍,至高可达 32P FLOPS AI 算力。NVIDIA H800 GPU 匹配第四代 Tensor Core 配合 Transformer 引擎(FP8 精度),与上一代产品相比,可为大模型 AI 训练速度带来高达 9 倍提升,可将大模型 AI 推理速度提升高达 30 倍。
l 灵活架构
联想问天 WA7780 G3 AI 大模型训练服务器, 为了满足 AI 超大模型训练场景下,GPU 服务器间高速数据通信的需求,支持 IB、RoCE 等多种对外网络连接方案。最高可以支持 8 张 RDMA 高速网卡,提供 3.2Tb/s 聚合带宽。充分满足了超大模型训练并行计算时,跨节点的通信需求。同时,在本地存储的设计上,采用了 GPUDirect Storage(GDS) 技术。通过 GDS 技术,GPU 与 NVMe 实现了快速低延迟互联,能够有效提高训练数据载入的速度,提升大模型训练的性能。
l 节能高效
联想问天 WA7780 G3 AI 大模型训练服务器,在产品设计中采用了三重独立风道设计,针对不同部件的散热特征,进行了系统性的优化,有效降低了由风扇带来的散热功耗。相比同级别产品,联想问天 WA7780 G3 AI 大模型训练服务器功耗降低约 10%。同时,为了满足未来智算中心对 PUE 值更低的要求,本产品预留了液冷冷板设计,未来将支持液冷,这将大幅度节省在 AI 大模型训练过程中,因系统散热带来的额外能耗,PUE 值有望低于 1.1。
联想问天 WA5480 G3 AI 训推一体服务器:多元丰富,稳定可靠
从机器视觉、推荐系统,自然语言处理,再到更为复杂的 AI 大模型,不同 AI 应用场景对于 AI 服务器有着不同要求。本次发布会一同亮相的联想问天 WA5480 G3 AI 训推一体服务器,是联想问天品牌中的一款 4U 机架式 AI 服务器,支持多元的算力和丰富的生态,能够为 AI 模型的训练推理提供极致可靠的算力,加速人工智能在千行百业的落地,从而推动各行业乃至整个社会的智能化变革进程。
l 多元算力
联想问天 WA5480 G3 AI 训推一体服务器采用 2 颗第四代英特尔®至强®可扩展处理器,支持最新 PCIe5.0。通过 PCIe 扩展,最多可以支持 10 张包括最新 NVIDIAH800 GPU 在内的,多类型、多品牌 AI 加速卡。可以灵活应用于 AI 通用模型训练、大模型推理、AI 生成、云游戏、科学计算等多种应用场景,为 AI 的多样场景提供多元算力。
l 灵活拓扑
联想问天 WA5480 G3 AI 训推一体服务器在 CPU-GPU 互联的硬件设计上也充分体现了灵活多变的设计理念。联想问天 WA5480 G3 AI 训推一体服务器基于不同 AI 工作负载,可以为客户提供包括直通、Balance、Common 多种 CPU-GPU 互联方式,避免了因为 CPU-GPU 数据通信方式单一与工作负载不匹配,带来的潜在性能瓶颈和系统效率下降。结合不同种类,不同数量的加速卡选择,真正实现了对 AI 各种复杂场景的完美匹配。
l 极致可靠
联想问天 WA5480 G3 AI 训推一体服务器充分考虑了设计冗余,为 AI 算力提供了安全稳定的运行环境。支持电源 N+N 冗余,节点内电源间互为备份,对外可以连接双路市电,保障服务器 24 小时在线运行。支持 CPU、GPU、内存等关键部件的功耗监测,整机功耗封顶调控,动态保障服务器运行在合理的功耗区间,保证性能的稳定,以及风扇 N+1 冗余等多种安全设计保障高环温无间断运行。
这两款 AI 服务器新品是「联想问天」品牌家族重要的组成部分,传承了联想服务器高性能、高可靠、高扩展、低功耗「三高一低」的特性,具备「本地创新、敏捷高效」的品牌内涵。未来,联想问天 WA7780 G3AI 大模型训练服务器和联想问天 WA5480 G3 AI 训推一体服务器将与联想其它 AI 基础设施产品组合多向赋能,助力 AI 算力覆盖 AI 全域应用。同时,配合联想领先的液冷技术,联想 AI 导向的算力基础设施,将持续助力 AI 算力绿色赋能,为普慧算力铸造牢固的「基石」。