
四年 4.5 亿美元融资,这家快速发展的英国公司正瞄准中国 AI 芯片市场。
人工智能时代,计算架构受到了前所未有的挑战。在传统的 CPU 以及更接近深度学习计算方式的 GPU 之上,专门为机器智能设计的处理器架构 IPU 成为热点。
说起 IPU,就不得不提到一家总部位于英国布里斯托的公司——Graphcore。成立于 2016 年,这家公司仅用四年时间就具备了量产自研 IPU 的能力,并且在硬件 IPU 处理器之上,架构了名为 POPLAR 的软件栈及开发工具。与此同时,在世界范围内,Graphcore 构建了针对本地访问和云访问的渠道合作伙伴关系。
四年时间内,Graphcore 总计融资 4.5 亿美元,投资方不仅包括欧洲知名科技风投公司 Amadeus Capital Partners、Draper Esprit,还包括来自硅谷的资本 Foundation Capital 以及红杉等。更重要的是,在金融投资者之外,Graphcore 还获得了包括宝马、博世、戴尔、微软、三星在内的产业资本的支持。

近来,Graphcore 在中国内地动作频频。5 月 12 日,在 OCP Global Summit 上,阿里巴巴异构计算首席科学家张伟丰博士宣布 Graphcore 支持 ODLA 的接口标准。5 月 20 日,在百度 Wave Summit 2020 上,百度集团副总裁吴甜女士宣布 Graphcore 成为飞桨硬件生态圈的创始成员之一。
7 月 8 日,Graphcore 宣布正式发布基于 IPU 的开发者云,面向中国的客户、大学、研究机构和个人研究者免费使用,使得前沿的机器智能创新者可以轻松获取 IPU 进行前沿 AI 模型的云端训练与推理。值得一提的是,该开发者云是中国首款 IPU 开发者云,部署在金山云上,使用了 IPU PCIe 卡适配完成的浪潮 NF5568M5 服务器和戴尔 DSS8440 服务器。此外,配合开发者云,Graphcore 的创新社区也已全面正式上线。这也是 Graphcore 积极拥抱中国 AI 生态系统的体现。
被阿里巴巴及百度列为好友,Graphcore 靠的是在硬件上的实力。官方介绍,在现有以及下一代的模型上,Graphcore IPU 的性能均领先于 GPU。在自然语言处理方面,速度能够提升 20%-50%;在图像分类方面,能够达到 6 倍的吞吐量及更低的时延;在金融领域,一些模型能够达到原先 26 倍的训练速度。
不仅如此,在疫情期间,Graphcore 也发挥了重要作用。5 月 27 日,在英国 Intelligent Health 峰会上,微软机器学习科学家分享了使用 IPU 训练 CXR 模型的性能参数。在运行微软 COVID-19 影像分析的算法模型的时,IPU 能够在 30 分钟之内完成在 NVIDIA GPU 上需要 5 个小时的训练工作量。
之所以能达成如此突破性的表现,是因为 IPU 在计算架构上的重构。当前,机器学习计算的常用处理器架构是 CPU+GPU 的异构计算模式。CPU 是针对应用和网络设计的标量处理器,GPU 针对图形和高性能计算,是向量处理器。然而,AI 计算的底层是以计算图为表征的,因此需要全新的处理架构。IPU 正是针对处理计算图设计的处理器。
与传统 CPU、GPU 相比,IPU 采用大规模并行 MIMD 的处理器内核,并搭载高达 300MB 的分布式片上 SRAM。相对于 CPU 的 DDR2 子系统或 GPU 的 DDR、HBM,这一计算架构能够做到 10 至 320 倍的性能提升。

目前,Grapgcore 已经量产的处理器名为 GC2。采用 16 纳米 TSMC 工艺。片内架构有 1216 个 IPU-Tiles,每个 Tile 有独立的 IPU 核作为计算以及 In-Processor-Memory,即处理器之内的内存。对于整个 GC2 来说,共计 7296 个线程,也就意味着能够支持 7296 个程序并行运行。整片 In-Processor-Memory 共计 300MB。
Graphcore 获得了 AI 领域众多创新者的背书,包括 DeepMind 联合创始人 Demis Hassabis、剑桥大学教授及 Uber 首席科学家 Zoubin Ghahramani、加州大学伯克利的教授 PieterAbbeel 以及 OpenAI 的几位创始人。

英国半导体之父、Arm 的联合创始人 Hermann 爵士这样说:「在计算机历史上只发生过三次革命,一次是 70 年代的 CPU,第二次是 90 年代的 GPU,而 Graphcore 就是第三次革命。」他指的是 Graphcore 率先提出了为 AI 计算而生的 IPU。人工智能教父 Geoff Hinton 教授也曾表示:「我们需要不同类型的计算机来处理一些新的机器学习的系统。」并指出 IPU 就是这样一个系统。