
只有通过 AI 算法对整个 AI 算力平台系统的重新定义,才能帮助企业支撑 AI「1+N」应用场景的需求。
6 月 20 日,人工智能企业第四范式「标新立异」产品发布会在北京召开,第四范式宣布将聚焦产业变革新范式,成为帮助企业实现智能化转型的重要伙伴,并发布了企业 AI 转型的「1+N」战略方法和企业级 AI 软硬一体集成系统——SageOne,为企业 AI 转型提供「软硬」一体的全栈能力支撑。
发布会上,第四范式 CEO 戴文渊、首席架构师胡时伟、首席研究科学家陈雨强分别分享了对企业 AI 转型的战略思考、产品体系构建和技术研发方向等内容,向现场来自英特尔、百胜中国、工商银行、瑞金医院等产业和行业合作伙伴的重要领导,全面展现了第四范式未来发展目标和产业蓝图。
新范式,企业全面拥抱智能化转型
据 Gartner 2019 CIO 调查显示,过去四年中企业部署人工智能(AI)的企业数量增长了 270%,并在 2018 年增长了两倍。Gartner 预测,到 2021 年,70%的企业将通过 AI 来帮助员工提高工作效率。管理者正在考虑如何加速部署 AI 在企业整体运营和每一核心业务流程中。
基于如此趋势,戴文渊表示越来越多的企业开始进行全面的 AI 转型,进入到基于数据来制定决策、推出新产品和创造新商业模式的时期,称之为产业变革的新范式。在过去 4 年,第四范式助力 7617 个客户的 12648 个场景,帮助他们进入到新的范式。
在帮助企业转型及应用 AI 的过程中,第四范式总结出企业 AI 转型的「1+N」战略方法。「1」是指利用 AI 达到极致效果,在自己的核心业务上建立绝对优势;「N」是借力科技创新带来的基础设施成本的降低,规模化的落地于更多业务场景,提升整体经营效率。
企业的核心业务通常有 1 或数个,在实际经营中,核心业务创造的营收占比可达 80% 甚至更多,因而 1% 的提升就足以改变企业竞争格局。以互联网应用为例,「千人千面」的个性化服务就是 AI 化的结果,最终,用户活跃度有多少提升,有多少转化均取决于「千人千面」的程度与效果。而对于以「供应链」为核心的零售及制造业,其竞争力取决于 AI 能在多大程度上提升供应链效率,降低成本。面对核心业务,AI 须做到极致效果,「毕其功于一役。」
N 则是指企业在全面 AI 改造过程中,面对成百上千个分散场景时,如果每个都做到极致,投入产出比低,因而需要规模化、高效的 AI 落地能力。假设一个企业有一千个场景,其中一个场景提升 10 倍,对整个企业来说,只有百分之一的提升。而如果能高效地完成一千个场景的全面覆盖,即使每个场景只提升 1 倍,那也百分之百的提升。面对场景众多的企业,AI 的「规模化落地」能力是企业全面智能化转型的关键。
新物种,SageOne 软硬一体系统诞生
帮助企业实现核心业务 AI 应用的极致效果和大规模 AI 应用场景的快速落地,传统算力暴露了先天缺陷,解决算力问题成为企业 AI 转型的关键。第四范式联合创始人、首席架构师胡时伟表示:传统算力和 AI 应用负载之间存在天然的鸿沟,传统算力只是解决在计算、访存、I/O 带宽的局部密集问题,而 AI 应用负载则需要解决全部密集的问题。发展企业级 AI 专用算力已经成为行业的普遍共识和大势所趋。
第四范式本次发布的企业级 AI 软硬一体集成系统——SageOne,是一个全新的企业级产品物种,摒弃了传统算力堆砌硬件的方式,而采用由软件定义的专用 AI 系统架构,更好的理解 AI 算法的运算架构与逻辑,更深层次软硬件一体化的优化和加速,全面满足企业 AI 应用的算力需求。
SageOne 内置第四范式领先的自研 AI 训练引擎、AI 推理引擎和 AI 特征存储引擎三大核心引擎,通过业界领先的「软件定义计算」软硬一体技术构建了闭环企业 AI 系统,贯通硬件基础设施、AI 核心引擎、AI 平台和 AI 业务应用的全价值链条,全面支撑企业 AI"1+N "业务场景应用需求。
以第四范式高维算法为基础,SageOne 搭载第四范自主研发的硬件加速卡——4Paradigm ATX800,内置模型训练和特征工程等多种加速能力,支持自动优化训练超参数、高位特征计算过程 I/O 加速和高维 GBDT 训练加速等应用,在企业应用场景中表现出高达 10 倍的训练性能。
SageOne 内置第四范式自主研发的高维、分布式网络通讯协议 Swift,集成 pPRC 自研网络通信框架、零拷贝数据交换协议等 AI 领先通讯技术,结合基于 CLX-AP 架构的参数服务器集群,展现出业界顶级机器学习性能表现。SageOne 在高维特征计算过程 I/O 最大 10X 加速,高维稀疏场景模型训练比 GPU 提速 5X 以上,自研 pRPC 通信框架比百度 bRPC 和谷歌 gRPC 提速 3-10X。
内置行业领先的自研实时特征计算引擎和模型预估引擎,SageOne 为企业 AI 应用提供特征处理过程免开发上线、线下线上一致性保证、一键生成预估服务、异构模型统一服务等 AI 核心应用服务,结合非易失性存储的无限缓存和超低延迟内存存储等硬件技术,确保企业 AI 应用时具备海量量时序特征计算和万亿维模型实时推理能力的同时,提供百万级并发实时请求支持和 99.9% 请求毫秒级响应的高并发业务极速响应服务。
此外,第四范式和英特尔联合实验室一直探索最佳优化技术,并针对最新 Cascade Lake-AP 处理器的全新 AVX512 指令集、多核心及主频利用率和 CLX AP 微架构 IO 总线的利用率进行全面优化。
胡时伟认为,解决企业 AI 应用算力负载问题,单靠增加硬件是无法完成的。只有通过 AI 算法对整个 AI 算力平台系统的重新定义,才能帮助企业支撑 AI「1+N」应用场景的需求。
新 AutoML,产业变革加速器
今天,产业变革才刚刚拉开帷幕,还需要更多创新技术加速发展。第四范式每年投入超 50% 资源在未来科技研发上,不断探索、验证和投产真正的企业级 AI 应用技术,持续加速产业变革进程。第四范式联合创始人、首席科学家陈雨强为现场嘉宾和媒体记者详细展示了第四范式在 GEN0(投产技术)、GEN1(验证技术)、GEN2(探索技术)的技术布局,勾勒出未来企业级 AI 技术的发展方向和蓝图。
AI 应用规模化的前提是低门槛、自动化的 AI 技术,其中,关键性技术是 AutoML。第四范式在 AutoML 技术研发和产品落地领域走在世界前列,现场陈雨强首次提出了全新特性的 AutoML 2.0 技术。AutoML 2.0 不仅是世界首个交互式 AutoML 技术,同时具备自动跨表特征增强能力。在世界知名的 Kaggle 机器学习竞赛中,第四范式 AutoML 2.0 与数据科学家共同挑战多项竞赛,竞赛结果数据显示全世界平均每 7-10 位数据科学竞赛选手,只有 1 位能击败第四范式 AutoML 2.0;而在结构化机器学习问题上第四范式 AutoML 2.0 比 Google Cloud AutoML 排名靠前 61.2%,在图像分类问题上比它排名靠前 64.2%。
基于目前企业 AI 应用的痛点问题,第四范式未来还将引入隐私保护迁移学习(AutoPTL)、自动半监督机器学习(AutoSSL)、自动正样本和无标签样本学习 (AutoPU)、自动知识图谱嵌入(AutoKGE)等众多 Auto「黑科技」到产品体系中,提高企业 AI 应用率和价值。
新生态,第四范式发布「启航」计划
以 AI For Everyone 为企业愿景,第四范式致力于携手客户与行业伙伴,把 AI 带到每一个行业,普惠人们的生活。发布会上,第四范式宣布开启「启航」合作伙伴计划,着力打造基于「先知」平台的生态体系建设。
「推动各领域的企业 AI 转型,进入到新范式,仅靠第四范式一家公司的力量是不够的。」第四范式商务副总裁梁军在「启航」计划启动仪式上表示,第四范式面向合作伙伴和开发者的开放,将越来越全面和深入,让越来越多的行业和企业能够低门槛地获取 AI 能力。基于先知平台,第四范式建立起产品赋能、咨询赋能、交付赋能、营销赋能、技术赋能五大赋能中心,正与广大解决方案商、咨询服务商、实施服务商、渠道分销商及开发者开展生态合作,形成一个强强联合、互补共赢的 AI 合作伙伴生态,共同启航 AI 蓝海。
人工智能被认为是引领新一轮科技革命和产业变革的战略性技术,AI 转型不仅是企业战略上的需要,更成为企业未来竞争力和创新力的关键。第四范式将继续发挥自身在算法研究、技术研发等方面的优势,融合领先硬件技术,为客户和合作伙伴带来更多的创新技术和产品,为 AI 在更多企业的落地贡献力量。