
此次第四范式发布的多款重磅 AI 新品,完整构建从 AI 算力、AIOS、自动化 AI 生产到线上化智能运营的全流程企业 AI 产品体系,解决数据治理难、人才门槛高、业务价值难和算力成本贵等 AI 应用难题,加速推动 AI 在各行各业的全面落地生花,助力以人工智能为代表的创新技术应用与基础设施建设。
8 月 20 日,上海。第四范式召开年度发布会,以「万悟赋能 商业生花」为主题,重磅推出了 Sage AIOS。Sage AIOS 的诞生,在中国乃至全球开辟了企业级 AI 操作系统新的里程碑。与 Sage AIOS 同时发布的新品还有第四范式自动化 AI 生产力平台 Sage HyperCycle ML、线上化智能运营系统天枢以及全新 AI 算力平台 SageOne。目前,第四范式覆盖从算力、操作系统、生产平台到业务系统的全栈 AI 产品矩阵,助力企业全面的智能化转型。
今天,AI 在各个行业落地生花,然而企业在 AI 应用过程中依然面临各种艰难险阻。发布会现场,第四范式创始人兼 CEO 戴文渊对此深有体会:「多年来第四范式团队冲在 AI 落地的最前线,在摸爬滚打中,我们总结出数据治理难、科学家稀缺、业务价值不佳以及算力成本负担重,是企业 AI 转型中四个最常见的阻力。这些问题归根结底是因为缺少基于规范和标准的基础设施,所以,今天我们设计和构建了更标准化的 AI 产品。」

革新数据形式 为 AI 量身定做的操作系统 Sage AIOS
定位于 AI 时代的 Windows(操作系统),第四范式发布了革新性产品 Sage AIOS。众所周知,Windows 在 PC 时代的地位不可撼动,在其通用且强大的平台上,运行着各种应用软件,并基于低门槛的「桌面管理」实现人人可用。Sage AIOS 作为人工智能的标准化管理平台,同样封装了各类 AI 应用,包括给 AI 科学家和开发者使用的工具类应用,以及针对某个场景一键上线的业务类应用。
AIOS 最为重要的设计是数据治理。第四范式在帮助企业落地 AI 的过程中发现,数据治理甚至占据高达 95% 的时间,即便花费了这么多的时间,数据质量问题仍然困扰着 AI 业务效果的提升,效率和效果成为企业数据治理的两大难题。AI 需要支持数据一致性、时序性和闭环的数据治理系统,而定义好数据形式,可以同时满足这三个需求。
第四范式 Sage AIOS 平台对于「数据形式」的定义是创新性的。具体而言,AIOS 平台上规定了数据的准备和使用方式,其中包括不同业务场景中的模型需要什么样的数据,对应的数据需要从什么 IT 系统上去调取,以及如何将这些数据处理为 AI ready 的数据、「投喂」到 AI 系统中。
针对不同场景 AI 数据形式不同的问题,Sage AIOS 浓缩了第四范式在多个业务场景下数据治理的经验。在 AIOS 平台上,企业想要构建某个 AI 应用场景,如推荐、反欺诈等,只需一键进入相应场景的数据形式、便可直接开始构建 AI,1-2 天即能落地一个 AI 应用。长期来看,Sage AIOS 将沉淀越来越丰富的数据形式,承载越来越多的 AI 应用。
如果说定义了「数据形式」,相当于定义了 AI 版 Windows 的文件格式,那么有效的资源调度与管理机制,则是 Windows 的「进程调度器」,Sage AIOS 采用 HyperScheduler 动态地对各个任务进行合理的资源分配,有效管理调度 CPU、GPU、加速卡等各类异构设备资源,从而避免 AI 应用资源分配不均导致的任务响应慢、宕机等问题,将资源利用率提升 50%,AI 全流程耗时节约三分之二时间。
PC 时代,Windows 用超越 DOS 的简洁的人机交互界面,通过 Word、PDF 等无数种标准化文件格式,助推 PC for Everyone。AI 时代,第四范式 Sage AIOS 采用极简、通识易用的交互界面,首次让 AI 进入到 AI 桌面应用的发展阶段,将各种数据形式进行集中化中台管理,以消弭 AI 落地鸿沟,实现 AI for Everyone。

第四范式 Sage AIOS 产品界面
破解人才之困 自动化 AI 构建平台 HyperCycle ML
搭建完规范化的 AI 操作系统,企业开始准备规模化应用 AI,此时,AI 科学家短缺成为瓶颈——据第三方公司调查显示,每年新增 100 万个 AI 应用场景,而每年最多新增 1000 名科学家,这导致了严重的 AI 应用需求与科学家之间的供需矛盾。
AI 人才培养需要一定周期,为了帮助企业尽快规模化应用 AI,第四范式在 AIOS 平台上专为业务人员等非 AI 专业人士,准备了名为「HyperCycle ML」的 AI 高级语言。基于第四范式 AutoML 技术和独创的「库伯学习圈」方法论,HyperCycle ML 将 AI 过程简化为「行为、反馈、学习、应用」四步,自动完成从数据引入、数据定义、特征处理、模型训练、模型应用和模型自学习的 AI 全流程,操作简便易用,让用户能像使用自动相机拍照一样建立 AI 应用。

第四范式 HyperCycle ML 产品界面
HyperCycle ML 把 AI 繁琐重复和高难度的数百个模块工作全部交给机器,建模时间由原来的 400 小时缩短到 10 小时,自动化模型的精准度目前可以达到 Top10% 的 AI 科学家的水平。此外,HyperCycle ML 是一个线上闭环,会自动收集线上的行为和反馈数据进行自学习,以确保稳定、持续迭代的模型效果。
聚焦业务价值 线上业务智能运营系统「天枢」
Sage AIOS 平台上首个平台型拳头应用,是为传统企业提供线上用户留存优化和增长优化的运营产品「天枢」。在线化是当下最大趋势,而全球公共卫生环境与 5G 等技术同样在加速这一趋势——据 App Annie 报告,因为疫情,在线化和移动化进程快进了 2-3 年。传统线下行业的竞争仅限于商圈同品类的店铺,但迁移到了线上,竞争泛化为无差异的用户时间竞争。这些竞争或许发生在今日头条与银行应用之间,也可能是电商与阅读类应用的竞争,这场竞争的终点是用户留存。
天枢产品做留存的产品逻辑,相当于给线上的门店植入一个人工智能的大脑,这个大脑能够察言观色最快地响应用户的需要,并通过一个实时的数据流把所有的场景连接起来,在每个场景、每个细节上打动用户,提升终端用户体验。截止目前,第四范式天枢已经助力零售、银行、媒体和互联网等行业上千家企业的在线化转型,依托于智能搜索、智能推荐、智能客服和智能推送等服务,帮助全球知名餐饮集团、大型连锁超市、国有银行和顶级电商平台的线上业务取得了理想的业务效果。
可负担的算力成本 软硬一体算力平台 SageOne
随着 AI 在行业的广泛落地,算力的需求和成本猛增成为企业应用 AI 的又一挑战。据 Gartner 预测,2022 年平均每个企业在 AI 算力上的支出会是 18 年的 4 倍,总体市场支出将超过 50 亿美元。在算力高昂成本的背后,实际上是算力的巨大浪费——企业数据中心对 AI 负载进行针对性优化,算力平均使用率依然达不到 60%。
第四范式 SageOne 是为 AI 量身定做的软件定义算力平台,面向整个 AI 生命周期全局优化。AI 应用的不同步骤,对计算资源、存储网络有差异化的要求,第四范式深入了解每一个环节负载需求,将计算、存储、网路、调度全方面动态考虑,有针对性地进行优化,真正解决 AI 算力浪费的问题。在某连锁餐饮企业实际应用场景中,SageOne 以一顶十,以 8 台替换了 88 台通用服务器集群。

目前国内 AI 算力产业处于持续探索和耕耘期,AI 基础设施的发展是大家共同关心的话题。第四范式作为 AI 基础设施产业中的一员,一直与国内 AI 企业保持紧密合作,包括与华为等在内的多个芯片厂商联合攻坚,软硬件互相适配,为建设国内完整的 AI 产业链添砖加瓦。
第四范式 AI 落地成绩单
第四范式总裁裴沵思在发布会上介绍了第四范式在去年一年的落地成绩单。在保持金融行业高速增长以外,零售行业在线化业务突飞猛进,制造、民航、能源、政府等传统行业也呈现出快速增长的态势。过去 5 年多时间,第四范式帮助超过 8000 家合作伙伴实现智能化转型,与他们一起探索商业模式进化与重构,蝉联 2018-2019 年 IDC 中国机器学习平台市场份额第一,这背后是机器学习平台从底层能力走向业务端的突破,也验证了 AI 通用平台产品的可行性。
对于第四范式的商业化发展,裴沵思表示,消费互联网和工业互联网引爆的数据增长,促使一个个经济体开始发生巨大变化。今年,在线化、数据增长的外部环境与第四范式 AI 规模化的内部战略一拍即合,给予第四范式在更多的行业和场景中利用机器发现规律,构建极致个人体验、提升经营决策价值的历史性机遇。以「数据-规律-价值」引擎为中心,第四范式的 AI 商业化齿轮正不断加速和扩张。
发布会现场,来自中国工商银行、来伊份、苏宁和中科大脑的客户代表分享了各自关于企业 AI 转型的洞察和实践,从商业模式、规模化应用、长尾效应和生态赋能等四个维度为企业 AI 落地应用提供了创新型参考。
此次第四范式发布的多款重磅 AI 新品,完整构建从 AI 算力、AIOS、自动化 AI 生产到线上化智能运营的全流程企业 AI 产品体系,解决数据治理难、人才门槛高、业务价值难和算力成本贵等 AI 应用难题,加速推动 AI 在各行各业的全面落地生花,助力以人工智能为代表的创新技术应用与基础设施建设。