AI 再次看到了实现商业化价值的曙光。
AI 再次看到了实现商业化价值的曙光。
这次, 借助 OpenAI 团队的 AI 梦想结晶, 现象级产品「ChatGPT」,AI 应用火出天际。
但是, 就目前而言,ChatGPT 和之前的 AI 产品一样, 仍未随之出现可见的商业化模式。
既出人意料而又无意外, 这看上去矛盾。但多年的实践证明, 作为技术应用大国, 中国对原创技术的商业化应用探索, 常能领先。如今, 这对矛盾又一次在类 ChatGPT 商业化价值探索领域, 闪耀着这抹中国色彩。
来自中国合肥的 AI 创业公司——未来智能, 开发的会议办公耳机 iFLYBUDS 系列, 即为类 ChatGPT 平台商业化做多年努力的结果呈现, 也是为之实现商业价值的生态系统, 提供垂直场景数据和训练迭代的智能终端。
多年的原创技术和应用大势都曾经或仍在证明:共建才能产生真正的商业繁荣, 而共建法则, 即构建生态平台。从 ChatGPT 聚合的技术应用前景看,ChatGPT 具备生态特征。
生态需要何种应用技术? 未来智能的会议耳机这种 AI 终端有哪些功能, 和 ChatGPT 有什么关系? 如何实现商业化?
老问题:ChatGPT 为何在美问世
从 AI 技术发展路径看,ChatGPT 并非新技术成果。在理论上,ChatGPT 没有更多创建——核心技术在 2017 年就已出现。
这次为很么能大火?「因为面向公众开放。」未来智能 CEO 马啸对华尔街见闻说,「原先 ChatGPT 做的是企业级服务, 或面向大型开发者, 这次对公众开放后掀起狂潮。」
ChatGPT 问世后横扫全球, 在短期内 (2 个月) 即积累了 1 亿用户, 成为全球迄今为止达成 1 亿用户最快的技术应用工具。说这是工具, 但究竟什么是 ChatGPT?
简单说,ChatGPT 是用 Problem Models(问题模型) 加上 1750 亿个参数/节点, 以之为基础提供巨量、有监督的学习数据, 借助 Transformer 架构,「投喂」给 AI 训练模型, 做出的 AI 应用效果。
这么解释或许过于抽象, 那就换种说法。
顾名思义,ChatGPT 中的「Chat」是「聊天」的意思,GPT 是什么? 这是 OpenAI 公司的一个 AI 技术名词。民生证券电子行业分析师方竞在研报中写道:ChatGPT 是基于 OpenAI GPT 技术的聊天机器人, 拥有 3000 亿单词的语料基础, 预训练出拥有 1750 亿个参数的模型。
由于 GPT 的技术核心 Transformer 神经网络架构在 2017 年就实现了开源——这个架构由谷歌创建, 其革命性在于能让 AI「听懂人话」——因此, 中国 AI 领域对此也不陌生。
但是, 中国在技术领域一向有着秉持实用主义的「优秀」传统, 不愿为看不见或不明确的未来持续投入资本。因此, 没有人像 OpenAI 那样, 持续保持大投入, 通过 Transformer 架构做 AI 技术开发。
「大模型要烧很多钱, 因为要大规模做算力分布式节点投入。」马啸说,「所以 2017 年以来, 国内都在观望。」
从现实的角度看, 国内不敢投入, 也确实因为基于 Transformer 架构的 AI 技术开发成本难以承受。
自 2017 年,Transformer 神经网络架构问世,AI 即进入大模型阶段。这什么意思? 大模型有三要素, 即算力、算法和数据。这三要素的相互关系是, 算力的强弱, 决定算法的效率, 而算法又决定数据的有效性;反过来, 数据是训练算法的要件, 能决定 AI 学到的知识量。
在业界, 能提供高效 AI 训练的载体是英伟达的 A100 和 H100 等 AI 专用显卡。这种专用显卡与普通消费级显卡的区别在于, 后者通常会将部分算力让渡于光追等功能, 而前者的特点是从硬件设计到软件配套, 都为 all in AI 服务。
如此很明显,GPT 的训练效果优劣, 与投入的显卡数量有关——巨额成本即源于此。
这成本多高呢? 据说有机构做了测算, 训练一个 GPT-3, 需要至少 1024 张 A100 显卡持续运转 30 天, 而 A100 显卡最便宜的版本, 价格也高达 8769 美元。也就是说, 为 AI 训练做最基础的核心硬件准备, 就得投入 880 万美元。
除了最基础的高额硬件投入,ChatGPT 训练所耗费的成本才是不可承受之重。训练一次, 需要 1000 万美元, 要训练出一个 GPT-3, 以每天训练 10 次, 持续 30 天计算, 需要投入 30 亿美元。
这就是为什么国内对开发基于 Transformer 架构的 GPT 技术缺乏探索热情的原因。
因为, 成本太高!
样本:「未来智能」会议耳机
现在, 美国 OpenAI 用实力证明 GPT 技术应用的有效性。
国内闻风而动。
但是, 出于同样的原因——实用主义——国内对新技术全部热情的考量源自「这种技术能不能创造出确定的应用商业价值」。
现在,ChatGPT 刚刚问世, 还没出现能大规模落地的商业模式。此时, 中国技术公司行动的时刻到了。
就像在顶层话语体系中, 相对于传统的西方式现代化, 有中国式现代化一样 (类似的还有相对于美国梦的中国梦), 国内也会出现中国式 ChatGPT, 顶层已有此方面的明确指向。
在马啸看来, 中国式 ChatGPT, 可能的演进路径是数家像百度、腾讯或阿里那样的大厂负责平台搭建, 之后在此平台上, 必然会有「大量基于垂直领域的微调模型, 在 (中国式)ChatGPT 上做垂直领域服务」。
这是互联网和移动互联网技术和商业模式发展的历史路径, 也很可能是 ChatGPT 在中国发展的未来方向。
一旦国内 ChatGPT 开放 API 接口, 这些做垂直领域小模型技术开发或服务的公司, 就能随之接入平台, 为之提供垂直细分场景的训练数据和成果, 共同为中国式 ChatGPT 平台的商业繁荣添砖加瓦。
有没有这种公司在做这种探索?
答案:有。
马啸领导的未来智能, 已经持续开发了多年 AI 训练的终端:办公会议耳机。这种品类, 立足于细分的办公会议场景, 解决办公场景录音、记录、文字转化或语言翻译等多种问题, 目的是帮助会议参与人提升办公效率。
办公会议耳机的定位, 也就是目标消费群体, 包括城市白领、政府官员、律师、记者、外贸从业人员、跨国公司管理和券商分析师等, 从中提炼符合职业标准提问的问题模板, 以供后续同样场景做调用, 这能大幅提升交流效率。
在此过程中, 实际上就涉及了垂直领域多种职业的特定语义标签/参数提炼, 形成大规模的海量用户数据 (库), 近似于创建语义大模型。在此基础上, 随着耳机目标用户的高频日常使用, 相当于在做标准职业问题模板的 AI 训练。这是未来智能开发的办公会议耳机与 ChatGPT 的内在关系写照。
举个例子, 职业投资人经常跟企业开会, 以更全面了解企业情况, 以此为投资与否提供参考依据。一般来说, 投资人会经常问些共性问题:比如企业年营收多少? 有多少盈利? 毛利或估值是多少? 这种大量的重复性问题, 可通过会议耳机的 AI 技术做标准化特性提取。
当这种垂直职业的数据积累得越多, 会议耳机能提取的信息就越精准。通过高效问题模型训练, 就会有极大的机会涌现出非常有价值的服务。随后, 再通过这种优质服务, 带动耳机或其他可能的硬件端的销售, 以此形成商业闭环, 这就是技术和服务双轮驱动。
目前, 未来智能的办公会议耳机已迭代到第四代, 共四种类型。2022 年, 会议耳机出货量同比实现 10 倍增长。到 2024 年, 未来智能办公会议耳机销量将超过百万台。
更重要的是, 这种耳机的 AI 特性, 未来智能的存量或增量耳机都在平时的高频应用中, 持续为未来智能的双轮驱动闭环提供动力。
这就是中国式 ChatGPT 平台商业应用的实际发展和可见的商业价值路径。更重要的是, 这一路径经过实践被证明是切实有效的。
核心价值:推动生态共建
要明晰未来智能会议耳机的商业价值, 这也是中国式 ChatGPT 在垂直领域商业化可能的样本。对于这样的样本, 像建立在生成类问题模型基础上的 ChatGPT 技术应用, 同类技术原理的会议耳机,AI 技术的生成性如何形成?
华尔街见闻了解到, 未来智能当前推出的办公会议耳机, 自带的软件系统能实现自动学习。这种学习结果, 能在又一次的基于语言发音生成的语义文本过程中, 按照用户的发音习惯更新自动学习的准确率。由此形成数据训练效果循环迭代。
在用户语音和会议耳机「记录翻译」做「沟通」, 也就是 AI「听懂人话」时, 这种会议耳机的「智能」在一开始, 做不到精准理解和文本的准确记录。未来智能设计了一套询问最终文本是不是符合用户理想的系统, 以解决这个问题。
如果用户认可, 比如打勾, 就相当于给耳机做了一次训练;如果打叉, 那也是训练, 相当于告诉耳机, 文本结果不准确。通过这样的方式, 实施多轮使用训练迭代后, 耳机就会对用户的喜好, 越来越理解。当再生成语音转化成文本时, 会议耳机对语义的理解就会越来越接近原意。目前,iFLYBUDS 系列办公会议耳机的转写准确率已达 98%, 在业内首屈一指。
未来智能为用户设立的账号, 是提升「人机默契」的核心。比如声纹识别功能, 在用户使用会议耳机是, 耳机会自动根据声纹特质做匹配。一旦发现是某个曾经使用过耳机的人, 就自动关联该用户的沟通记录, 随之形成一张该用户的社交网络数据。
这张网将为该行为人的职业特征, 提炼重复性的标准问题的标签参数, 供 AI 训练模型跑数据。不同职业的共性问题参数, 即形成问题模型数据库。
从底层技术原理出发, 未来智能的办公会议耳机, 就是所有声音, 只要经过耳机, 都可被记录和处理。比如将线上或线下的会议语音转成文字, 这种文字可能是英文, 也可能是日文或其他语种。这要看用户需求是什么。
如果用户想将中文会议记录转成日文, 或将英文会议语音转成中文, 都能通过这种耳机实现。同时, 未来智能的办公会议耳机还具备强智能 AI 自动学习能力。
事实上, 华尔街见闻发现, 未来智能开发的办公会议耳机, 除了聚合多种 AI 应用能力, 实现围绕办公场景的效率提升。更具想象力的商业前景, 是其目标用户应用耳机的过程, 相当于在构建一套垂直细分市场的子生态。
若对整个过程简做要概括, 即在美国推出 ChatGPT 生成式 AI 应用聊天机器人前, 国内商业组织在做类似的技术应用探索。双方的区别是美方做高成本的 AI 技术验证, 中方做同类 AI 技术应用的商业化探索。
比如未来智能, 这家公司多年致力于围绕办公场景的细分领域研发 AI 提效工具——办公会议耳机。自 2021 年以来至今, 未来智能的会议耳机销售的存量和增量终端, 在高频应用过程中, 形成了领域内有商业闭环的子生态。这个子生态已运行了至少两年, 而且还能在推进商业落地的过程中逐步迭代。
不难预见, 一旦中国式 ChatGPT 问世, 开放 API 后, 未来智能的办公场景 AI 终端系统就可接入。这相当于给 ChatGPT 提供了办公场景的 AI 训练、数据和应用数据库和技术应用解决方案。
像诸如安卓和 Windows 等平台, 之所以具有超越想象的商业价值, 是因为在这个平台之上, 奔跑着海量的细分生态子系统。这些子系统, 共同构成了繁荣的整体大生态。在共建具有高度价值超级平台的同时, 子系统也在持续为其所在的垂直细分场景, 持续提供源源不断的商业动力。
这才是未来智能推出的会议耳机真正的、核心的、极具商业想象空间的价值核心, 也是必将出现的中国式 ChatGPT 为世界 AI 商业化落地做出的真正贡献。
来源:华尔街见闻