
2023年,以ChatGPT为代表的大模型应用掀起新一轮的人工智能革命。GPT从第一代的50亿个参数,逐渐壮大至GPT4.0的万亿级参数,这背后也意味着对芯片算力的需求的不断攀升。在人工智能时代,算力即生产力和资本。根据浪潮和IDC联合发布的《2020全球计算力指数评估报告》指出:计算力与经济增长紧密相关,计算力指数平均每提高1个点,数字经济和GDP将分别增长3.3‰和1.8‰。AI计算的占比正逐年提高,预计到2024年将达到23%。
2023 年,以 ChatGPT 为代表的大模型应用掀起新一轮的人工智能革命。GPT 从第一代的 50 亿个参数,逐渐壮大至 GPT4.0 的万亿级参数,这背后也意味着对芯片算力的需求的不断攀升。在人工智能时代,算力即生产力和资本。根据浪潮和 IDC 联合发布的《2020 全球计算力指数评估报告》指出:计算力与经济增长紧密相关,计算力指数平均每提高 1 个点,数字经济和 GDP 将分别增长 3.3‰和 1.8‰。AI 计算的占比正逐年提高,预计到 2024 年将达到 23%。
然而,我国却正在面临着海外高端算力芯片供应受限,且生成式 AI 芯片「一芯难求」的局面。AI 硬件自主可控成为当务之急。在这样的背景下,9 月 20 日,中国领先的互联网平台出海企业昆仑万维宣布将投资控股 AI 算力芯片企业艾捷科芯,根据昆仑万维公告,合计出资 6.8 亿元人民币,获得艾捷科芯 58% 的股权。增资后,艾捷科芯将纳入公司并表范围。
昆仑万维是生成式 AI 的积极拥抱者,今年 4 月 17 日,公司发布了「天工」通用大模型,其推理能力大幅领先 GPT3.5 和 LLaMA2。此次控股艾捷科芯之后,昆仑万维将进一步完善其 AI 版图,为生成式 AI 打下坚实的技术基石。此举不仅标志着昆仑万维成功完成了 AGI 与 AIGC 全产业链布局,也意味着国内生成式 AI 赛道中新添一员大将。
艾捷科芯:专注于生成式 AI 的高性能计算
昆仑万维投资控股的艾捷科芯,是一家专注于 AI 大算力及配套芯片的研发生产企业,尤其聚焦于生成式 AI 的智能计算。其核心团队汇集了来自芯片研发、集成电路、人工智能及大型语言模型等领域的顶尖专家和学者。
其中,公司创始人蒋毅敏博士是芯片领域的领军人物。他于 1996 年毕业于清华大学电子工程系,并在美国马里兰大学取得了电机工程硕士和博士学位。蒋毅敏博士在卫星、无线通信、数字电视、可配置矢量数字信号处理器等领域有重要创新突破。艾捷科芯算是蒋毅敏博士的第二次创业,早在 2005 年,蒋毅敏博士回国联合创立了半导体设计公司——北京中天联科科技有限公司,并出任首席技术官。凭借卓越的业绩,中天联科于 2009 年被国际知名评估机构 iSuppli 公司评为中国集成电路设计行业的领军者。
艾捷科芯创始人蒋毅敏博士
蒋毅敏博士不仅是一位出色的企业家,还是一位眼光独到的投资家。他是国内多家市值达数百亿元人民币半导体企业的董事(例如安路科技),并主导投资了盛科通信、半导体公司派瑞股份、OLED 显示驱动芯片公司云英谷等高科技企业。
「半导体行业观察」独家采访艾捷科芯蒋毅敏博士获悉,艾捷科芯所要打造的首先不是一款 DSA(Domain Specific Architecture,领域专用架构)芯片,也不做图形处理,而是旨在开发一款可编程的、具有高性能的 NPU 产品。在功能上,推理和训练都将会涉猎。在蒋毅敏博士看来,对于生成式 AI 芯片而言,软件生态的重要性不亚于芯片本身。
自从英伟达的 GPU 在生成式 AI 市场上取得巨大成功之后,在国际舞台上,许多企业已经认识到了生成式 AI 芯片的应用潜力,并投入了大量资源进行研发。其中不乏有传统的 AI 芯片公司和新进场的初创公司,如 Graphcore、Cerebras 和 SambaNova,都对生成式 AI 芯片赛道「虎视眈眈」,正在试图通过生成式 AI 芯片改变现有的竞争格局。不过这个市场不是那么容易,强如英特尔和 AMD,在打生成式 AI 市场上都略显吃力,其难度可想而知。
对此,蒋毅敏博士坦言,生成式 AI 芯片的研发难度确实很高。与传统 AI 芯片相比较而言,首先,像 ChatGPT 这样的 AI 应用需要大量的模型参数训练,其计算量很大,所需的并行处理能力更强,对算力本身的需求高;其次,它处理的数据量巨大,因此对内存带宽有很高的要求,即数据读取的速度要够快;最后,基于 Transformer 结构的大模型大量采用了注意力机制,与基于 CNN(卷积神经网络)和 RNN(递归神经网络)的 AI 芯片相比,生成式 AI 芯片中的神经元间连接众多,因此需要强大的扩展(Scale out)能力。
所以,可以看出生成式 AI 芯片面临的核心挑战主要有三个:一是如何提高计算速度;二是如何优化存储;三是如何有效地进行互联。在解决存储优化这一挑战时,许多当前市面上的主流生成式 AI 芯片选择采用了 HBM 技术。例如,英伟达的最新 GPU 使用的是 HBM3,而英特尔的 Gaudi2,专为大模型设计,采用的是 HBM2。HBM,全称「High Bandwidth Memory」,是一种高效、堆叠式的 DRAM 技术。与传统的 DDR 型 DRAM(如 DDR4 和 DDR5)相比,HBM 为用户提供了更大的数据传输带宽。蒋毅敏博士指出:「HBM 的优势在于其高存储密度,例如单颗芯片能达到 80G 的密度。但它的数据传输速率相对有限,大约可达到 1.2~2TB/s,并且功耗较大。所以,在存储密度与读取速度之间,我们需要做出权衡,这正是我们的创新点所在。」为了在技术上实现新的突破,公司正在考虑采纳一系列创新的架构设计。
值得一提的是,为了加速研发和产业化,艾捷科芯还与中国科学院微电子研究所以「产研结合、互利共赢」为宗旨,签署合作意向共建实验室。实验室主要聚焦于高性能计算领域的先进存储、封装技术的研发,以及与高性能算力系统集成的系统技术研发和产业化工作。
昆仑万维完成 AGI 与 AIGC 全产业链布局
据官网显示,昆仑万维是中国领先的互联网平台出海企业,深耕海外市场十余载,业务覆盖包括信息分发、社交、 娱乐、元宇宙、游戏及 AIGC 等多个领域。昆仑万维自 2020 年开始布局 AGI,经过三年的积累和沉淀,于今年 4 月 17 日发布了「天工」通用大模型,此后,昆仑万维又开始了积极探索大模型的落地。昆仑万维率先从搜索引擎方面突破,于 8 月 23 日发布了国内第一款融入大语言模型的搜索引擎——天工 AI 搜索,助推传统搜索迈入 AI 时代,成功实现了大模型应用的率先落地。
天工大模型的性能也表现不斐,在 9 月 16 日的 Benchmark GSM8K 测试中,天工以 80% 的正确率脱颖而出,大幅领先 GPT-3.5(57.1%)和 LLaMA2-70B(56.8%),即将接近 GPT-4。除了推理性能之外,天工大模型在 GSM8K、MMLU、C-EVAL、HumanEval 四项数据集测试中,天工大模型均获得较高的正确率。如下图所示,其核心性能均达到了国际领先水准。这不仅证明了天工大模型的「聪明」程度,更显示了其出色的通用适用性。
随着对艾捷科芯实现控股,昆仑万维的布局将涵盖大算力、大模型算法、AI 应用,进一步完善了其在 AGI 与 AIGC 的产业链布局。不仅如此,随着后续生成式 AI 芯片的推出和算力上的支持,昆仑万维将可以研究、开发并实施更为先进的 AI 算法和框架,有能力处理更复杂的 AI 应用,为用户提供即时和更为精确的反馈,从而提高用户体验。这种全产业链的布局有助于昆仑万维进一步推动 AI 产品的落地。
需要强调指出的是,昆仑万维已经构建起涵盖 AI 大模型、AI 搜索、AI 音乐、AI 游戏、AI 社交、AI 漫画等六大 AI 业务矩阵。因此,除了天工大模型和天工 AI 搜索之外,昆仑万维将会进一步开拓更广阔的生成式 AI 市场。蒋毅敏博士也指出,生成式 AI 市场的需求是多元的。目前市场上已经有许多基于生成式 AI 的应用,如生成文本、代码、搜索引擎和画图等。除此以外,包括 AI 游戏中的 NPC(非玩家角色)、私有云和数据保护在内的特定垂直领域,国内也会有大量的特定领域的需求。因此,从一个细分市场切入,进行深入研究和开发是比较好的策略。
而对于艾捷科芯而言,在获得昆仑万维投资背书之后,昆仑万维既是股东,又是下游的潜在客户,能够更好的帮助艾捷科芯做好产品定义,是双重助力的体现。
在蒋毅敏博士看来,要想在生成式 AI 领域中脱颖而出,有四点很关键:「首先,要定义好产品,明确使用场景和主要用例是什么?第二是找对人和团队。再者,技术路线的选择很重要;最后就是拼技术和执行力。」
结语:
从文本语言、图片、视频到各行各业,生成式 AI 的影响还在不断扩大。而昆仑万维和艾捷科芯这样上下游全产业链的紧密联动,将更有助于国内生成式 AI 的加速发展,进一步抢占先机,先发制人。
虽然在当下,生成式 AI 芯片是巨头的天下,但对于定制化和特定应用场景的需求,国内初创公司拥有先天的地理和文化优势,可以更快响应市场并精准定位。结合中国庞大的内需市场和产业链整合能力,国内初创企业有望分得一杯羹。从长远看,生成式 AI 芯片不仅是硬件升级,更将涉及到底层技术体系的革新,生成式 AI 芯片将是芯片公司所要攀登的新高地!群雄逐鹿,AI 芯片的号角再次吹响。
来源:互联网