
1 月 25 日,Wired 报道称,谷歌 DeepMind 已通过一项授权协议,吸纳语音 AI 公司 Hume AI 创始人兼 CEO Alan Cowen 及约七名核心工程师加入,加速补齐 Gemini 在语音与情感理解上的短板。
1 月 25 日,Wired 报道称,谷歌 DeepMind 已通过一项授权协议,吸纳语音 AI 公司 Hume AI 创始人兼 CEO Alan Cowen 及约七名核心工程师加入,加速补齐 Gemini 在语音与情感理解上的短板。
与 OpenAI、Meta 等厂商相比,谷歌的语音交互体验短板一直存在,但这并未影响其在刚刚过去的 2025 年逆袭,成为 AI 大模型赛道最受瞩目的巨头之一。此时以「收购式招聘」方式进行加码,对速度追求的强调,透露的却是其前所未有的竞争焦虑。
谷歌的这一举措看似矛盾,但对比 OpenAI 明确其首款 AI 硬件发布日程,开始着手将成熟的语音交互功能,落地成为可供用户直接接触的终端设备;联想集团从天禧、Qira 等 AI 智能体,到全新形态的 Maxwell 终端设备,均将语音等多模态交互作为重要亮点;以及苹果被爆推进研发一款语音交互的可穿戴 AI 胸针设备,其逻辑便开始明朗起来。
从 OpenAI 等大模型厂商,到联想集团、苹果等终端设备、场景落地厂商的集中加码,反映的是 AI 产业的一个众所周知但不容忽视的重要转折——模型之争降温,应用之争升级,而语音交互作为 AI 应用落地的关键入口,也成为行业竞争的前沿阵地。谷歌对其语音环节短板的补齐,与其说是为了巩固模型技术领先地位,毋宁说是在模型逆袭之后,为应用端竞争进行针对性能力准备。
而在此过程中,联想集团、苹果、三星等终端设备厂商,也开始进入价值释放与产业链身位重定阶段。AI 落地的核心触点,以及 AI 大模型适应场景需求进行针对性优化的重要数据采集来源,是这些厂商的核心价值所在。
从联想集团在 2026CES 上一次性集齐英伟达、英特尔、AMD、高通等全球主要几家芯片巨头,并成为谷歌终端布局的重要合作厂商之一可以看出,凭借这一核心价值,终端设备厂商正在成为整个 AI 产业链的整合者,主导 AI 落地应用的长期推进。
发力语音交互,争夺 AI 入口
谷歌此次使用「并购式招聘」模式,吸纳 Hume AI 全部知识产权的使用权及核心团队的同时,Hume AI 公司主体仍保持独立运营。这一模式的好处在于,谷歌可以快速获取顶尖人才和技术,而不必像传统并购一般面临繁琐的反垄断审查,拖慢布局进度,同时也免去了整合整家公司运营所带来的管理风险。
这一模式的使用显示出,AI 行业进入应用阶段之后,市场竞争空前加剧。科技巨头将产业布局速度,视为影响胜负的关键因素之一。
如今,竞争蔓延到语音交互环节,既是技术进入成熟阶段的表现,也是 AI 落地应用需求的必然。
从技术层面来看,Hume AI 的核心优势在于「情感智能」,其能通过语音信号识别用户情绪与心理状态,Cowen 本人即拥有心理学博士背景,是「情感建模」的重要支撑。这是谷歌的短板,但 OpenAI 旗下的 ChatGPT 则早已具备这一能力。
联想集团、苹果作为终端设备环节代表,直接将语音交互落地成为 Maxwell、AI 胸针这样的全新产品形态,也展现了深厚的技术储备。比如在声纹识别领域,联想集团提出的面向轻量级应用的非对称「注册-确认」声纹识别技术,支持设备端依据声纹特性(包括性别、年龄等)进行唤醒的功能,解决了语音中除内容外其他富信息的识别理解问题。

如果说 Hume AI 的「情感智能」,能够让 AI 在理解用户「买火车票」指令的同时,根据用户语气匹配高效(语气急时)或高性价比(语气缓时)购票方案,联想集团的声纹识别技术,则为 AI 判断是应该买成人票还是儿童票提供了技术支撑。
而在 AI 落地应用需求层面,语音交互的自然、高频属性(降低儿童、老人等使用门槛),对车载、智能家居、可穿戴、医疗等双手/视觉被占用或无屏幕场景的适应性,也决定了其将是未来 AI 交互的核心入口,亦即 AI 应用落地的「必争之地」。因为,只有这样的交互方式,才能真正释放 AI 的技术能力,带来变革性的用户体验。
据 AI 语音生成公司 ElevenLabs 近日披露,其年度经常性收入(ARR)已突破 3.3 亿美元(约合人民币 23.1 亿元),显示出市场对高质量语音技术的真实需求。
有了技术基础与市场需求,也就意味着市场爆发期的到来。谷歌在此时以「收购式招聘」模式,追求相关布局的快速落地,便显得顺理成章。企查查信息显示,近期联想集团除发布 Maxwell 之外,还入股了人机交互科技创新企业北京光帆科技有限公司,显示出终端硬件厂商也在加大语音等交互技术的布局。
与谷歌、OpenAI 等大模型厂商相比,联想集团等终端设备厂商占据着两大优势。一是能够整合不同模型能力,又更匹配终端设备的智能体平台;二是在终端设备技术与用户经营方面的长期积累。
智能体平台的打造,并非单纯的「模型列表制作」,而是作为一个任务执行者,代替用户完成其指定的工作。这就要求智能体能够自动匹配模型,自动拆解任务、调用信息,甚至自动识别需求、反馈结果,使得整个任务完成过程能够尽可能减少用户操作的复杂感。联想集团在 2026CES 上发布的智能模型编排、智能体内核与多智能体协作三项核心技术,正是这种智能体能力的核心支撑。并且,联想集团作为 PC、手机、可穿戴设备等多领域布局的国际终端设备龙头,其智能体打造中天然的终端设备适配逻辑,是单纯的大模型厂商无法比拟的。

而在终端设备技术与用户经营方面,比起大模型厂商的「从 0 开始」,联想集团等终端设备厂商的优势更是无法撼动。
这或许解释了联想集团的 Maxwell 能先于产业链其他环节厂商的同类产品推出,谷歌、字节等大模型厂商尽管也布局智能眼镜、「安克 AI 录音豆」等语音交互产品,但均选择与智能设备厂商合作。
随着谷歌、OpenAI 等大模型厂商,以及联想集团、苹果等终端设备厂商的持续加码,语音交互技术将进一步成熟,未来 AI 产业的终端、场景落地显然也将在入口支撑下,进入新一轮加速期。
释放终端价值,跻身产业 C 位
单从模型竞争角度来看,谷歌对 Hume AI 的收购,也表明行业竞争焦点正在迁移。
在 2024 年及以前的发展阶段,以大规模投入为基础的 Scaling Law 始终是大模型性能提升的核心逻辑,大模型厂商纷纷在参数规模、Token 长度、训练算力等维度展开激烈竞争。比如在参数规模上,最初出圈的 GPT3.5 参数规模仅为 200 亿,而当前主流大模型已突破万亿,甚至向 10 万亿进发。
但随着互联网数据逐渐枯竭,Scaling Law 的边际效应开始递减,近期新出的模型能力提升,较 2024 年以前已大幅降低,不同模型之间的差距也随着模型升级速度的减慢而缩小。
根据 Epoch AI 研究院的一份报告预测,高质量的英语语言数据可能会在 2026 年到 2032 年之间枯竭。这意味着,模型差距缩小的趋势将长期延续。
因此,模型整体性能的胜出,不再是行业竞争的主要焦点,更贴近真实交互体验与应用场景需要的细节优化开始取而代之。这就要求用于模型训练的数据,也更能反映真实世界的现实,而不仅仅是此前主要来自互联网世界的图文数据。
Hume AI 核心产品「共情语音接口」(Empathetic Voice Interface)的「情绪识别+动态回应」能力,即得益于公司聘请大量心理学专家,标注的海量真实对话中的情绪线索。
这种数据资源壁垒,正是联想集团等终端设备、场景服务厂商的独特优势。比如在终端设备方面,凭借数亿台级别的 AI PC、手机、智能穿戴设备,联想集团能直接获取真实世界的人类对话、物体移动、动植物生长等数据,这些数据正是大模型细节优化训练所需的稀缺资源。
因此,大模型厂商要想在新一轮竞争中占据主动权,要么自己掌握终端,要么与终端设备厂商合作。其中,与终端设备厂商合作是更快也更具确定性的途径。

仅本月以来,谷歌就与三星、联想集团、苹果三大国际终端设备巨头建立了新的合作,包括支持三星终端设备 AI 渗透数从 4 亿提升至 8 亿的计划、接入联想集团新发布的 Qira 个人超级智能体以及支持苹果的 Siri 升级。
其中,联想集团的 Qira 个人超级智能体,以情景感知为其三大特征之一,具备跨设备感知能力,能够深度理解使用语境、任务连贯性与个人行为习惯,与大模型对真实世界的数据需求高度匹配,印证了大模型厂商通过与终端设备厂商合作,获取更多稀缺数据资源的逻辑。
与其他终端设备厂商相比,联想集团也具备两大差异化优势,一是开放生态的多终端互联,二是应用场景服务的同步业务布局。
联想集团作为除苹果外,唯一一家在个人电脑和移动终端两大市场均占据可观份额,且同时布局开放的安卓与 Windows 生态系统的企业,不仅具有庞大的数据规模,且其开放的终端生态,可通过超级互联,将对不同设备的数据整合扩展到不同品牌,甚至不同系统,实现较封闭生态更显著的数据价值放大效应。
而以 SSG 业务为代表的应用场景服务,则使联想集团比单纯布局终端设备的企业,能更加深入具体的生产、生活场景,获取更深度、精细的数据资源。
因此,作为终端设备与场景服务的双重代表性企业,联想集团在 AI 产业链的话语权也随着 AI 应用的深入而持续增强。其在 2026CES 上与英伟达、英特尔、AMD、高通等全球主要几家芯片巨头的合作,覆盖了云服务商数据中心、企业级 AI 系统、AI PC 与新型 AI 原生终端,形成一张从云端到终端的 AI 全链条算力版图,展现的正是其在 AI 产业链的强大整合能力。

在大模型方面,联想集团除与谷歌之外,也与微软、阿里、字节、DeepSeek 等众多厂商合作,并在近日表达了与沙特阿拉伯 Humain、欧洲 Mistral AI 等更多厂商合作的意愿,这既是其模型能力多元化的需要,同时也体现出其在大模型环节同样扮演着有力的整合者角色。
随着谷歌、OpenAI、Meta 等大模型厂商在语音交互等领域的进一步加码,联想集团、三星、苹果这些终端设备厂商,在真实世界数据上的价值将持续释放,并由此占据更重要的产业链地位。
来源:互联网



