传统商业模式的胜利:技术之外,如何决胜智能语音赛场?

摘要

当人工智能创业黄金期过去、巨头林立时代到来,像声智科技一样的公司该如何定义自己的半径和未来。

陈孝良赶上了好时候。2016 年,他和几位同事从「体制内的好单位」中科院声学所离职,创办声智科技。那时,亚马逊 Echo 在海外引起的震荡还没有传到国内。

不到一年的时间,光景已大为不同。无论大公司还是创业公司,都开始一头扎进智能音箱的领域,密集开火。在刚刚过去的双 11,这个被快速催熟的市场迎来了高潮时刻,在巨头自杀式的促销活动中,本土智能音箱的销量终于实现了狂欢飞跃。

陈孝良顺便「坐收了渔翁之利」。

回声抵消、噪声抑制、声源定位、语音唤醒这些关乎智能音箱核心质量的声学技术,一直是陈孝良在中科院声学所时的研究方向。这家公司以产品的形式,将上述技术嵌入在芯片、模组、OS 或者云服务上,「你可以认为声智科技相当于手机领域的 MTK(联发科)」,陈孝良解释。

在业内,能提供这种垂直解决方案的创业公司寥寥。目前市面上,包括小米智能音箱在内的大部分智能音箱都无法离开声智科技的产品和技术,也让声智科技获得了数量不菲的订单。

这给从「科学家」向 CEO 转型中的陈孝良带来了信心。回想过去一年时间,陈孝良感慨声智科技最大的「幸运」是「找对了时机」。不过,智能音箱不是语音交互探索的起点,也不可能是终点。

因此,为业务领域如此垂直的声智科技找对下一个正确的「好时候」,是现在陈孝良身上最紧迫的任务。这将决定,当人工智能创业黄金期过去、巨头林立时代到来,像声智科技一样的公司该如何定义自己的半径和未来。

技术信仰与「传统」胜利

2016 年,陈孝良从中科院声学所离职时,和他一起离开的还有四位同事。那时,他已经在声学所供职超过 10 年。

「科学家」陈孝良看到了 Echo 带来的机会。要让 Echo「听到」人类的声音,核心硬件就是麦克风阵列。根据波束形成理论,利用多个麦克风收集的信号可以将某一方向传来的声音增强或抑制。而收到物理世界的声音信号后,还需要将这些信号传输到云端进行语音识别,背后依赖的则是大量数据样本的深度学习。

这种解决方案同时考验声学处理和深度学习两方面能力,和他们之间的匹配。然而对于陈孝良,技术反而成了「最容易」跨过去的门槛——还在声学所时,这些就是陈孝良和同事的研究方向。「这些技术我们原本是应用在潜艇上,我们也很了解 Echo 的技术细节,所以我们是非常清楚远场交互怎么做到更快更自然的。」


声智科技创始人陈孝良

更大的难题反而涌起在了技术之外。2016 年,陈孝良花了很长时间反复劝说潜在客户开始做智能音箱,但是,在市场非常不明朗的情况下,能够下定决心在智能音箱方面做投入的公司不多。

「其实还是要看时机,和管理层的决心。一方面我们『赌』的是这个方向对不对;另一方面也要看合作伙伴的决策层敢不敢冒险做这个事情。」陈孝良记得,2016 年 10 月,小米内部定下智能音箱的方案时,麦克风和现在用的很多芯片都还不能量产。「你要面向未来的时候,很多事情需要一些魄力,否则机会就会让给别人。"

2017 年,习惯了扮演「价格杀手」的小米推出了 299 元智能音箱,按下了触发红海市场的关键按钮。与此同时,产业链上的分工也逐渐走向整合,包括 Nuance、思必驰等公司都推出了类似的解决方案。但陈孝良认为,声智科技的优势是能「把算法不仅做到云端,也做到前端,利用技术优势把设备整体成本和功耗压到更低,形成远场识别的量产优化配置。」

「有很多人批评小米把价格压的这么低,所以也有人批评声智,但我们的确在这个过程中拿到很多订单。」陈孝良承认声智科技的「幸运」,但他同时强调,声智科技坚持的就是这种「更加传统」的商业模式:在某个技术点上树立明显的技术优势,然后出售具有高技术附加值的产品或方案。

以这种模式获得成功的公司有 Intel、MTK、高通等等。不过,将某种技术上的优势延伸成商业上的持续成功,声智科技需要找到更多的客户、场景,甚至与巨头的相处方式。


小米的智能音箱小爱同学,因 299 元定价被视作行业的低价杀手

所以,2016 年开始定好了智能音箱的「三年战略」后,陈孝良马上开始拓展适合远场语音交互的新场景。电视机顶盒成为了声智科技的下一个目标。

就像此前说服互联网公司的高管启动智能音箱的项目一样,陈孝良和团队要开始说服电视厂商升级现有的「语音智能解决方案」:「慢慢的,电视遥控器上的近场语音识别,也就是对着遥控器下指令的方式,肯定会被远场语音识别取代,这是一个必然的过程。语音是先天没有学习成本的。」

装在电视或者机顶盒上的麦克风阵列和语音识别模块有着和智能音箱不同的技术挑战,电视和机顶盒的放置位置也决定了众多声学算法和远场交互都需要重新设计,不仅仅只是提供性能更强的回声抵消和噪声抑制功能。

这会是又一个为声智科技带来丰厚订单的方向么?陈孝良也不太确定,团队内部「吵来吵去」,争论了很久。「其实最难的反而不是技术本身,而是判断明年爆发的技术是什么。判断错了,精力就白花了,但是千万不能别人做出来你再跟,时间差很重要,做第二名就很难有很好的竞争力。」

技术之上和「传统」之外

声智科技目前还是一家小公司,它的业务领域极度垂直。自从 2015 年兴起、在 2016 年到达顶峰的人工智能创业「黄金时代」已经开始退潮,像声智科技一样的「幸存者」需要考虑的问题变得非常现实:过去一段时间建立起的壁垒,是否能成为自己今后一段时间的发展加码?

技术、算法和数据已经不再能成为一家 AI 创业公司的壁垒,「技术永远在迭代更新,当技术不能呈现颠覆性的时候,技术的核心价值就会折扣。」陈孝良说。

更重要的事情存在于技术层面之上。对声智科技来说,在对的时间选择了正确的方向只是第一步。陈孝良为公司定下的是非常「朴素」的商业模式。「我不太习惯公司没有营收,所以声智不会做免费的服务换取『流量』或者『数据』,天下并没有免费的午餐,客户其实非常清楚免费的代价,声智更期望看到客户产品的成功,所以客户是否愿意付费也是考量客户产品投入的决心。」

这并不是一件容易的事。现在,在人工智能创业圈像声智科技专注做技术解决方案,并且以产品形式售卖的公司已经不多了。和陈孝良同时期创业的技术公司,不少已经做了战略上的调整。「有的去做平台,有的向上下游延伸,不少做 CV(计算机视觉)的公司已经去做安防摄像头了。」

在外部,巨头带来的压力也是不可忽略的。包括百度、腾讯、阿里甚至思必驰在内的公司致力于语音开放平台。陈孝良则相反的选择与巨头合作的方式以修补「木桶」。2017 年 7 月,在百度 AI 开发者大会上,声智科技与百度达成战略合作,为第三方产品制造商提供基于 DuerOS 平台的软硬件一体化解决方案。

10 月,声智科技还宣布了由百度、蓝港互动、洪泰基金、峰瑞资本联合出资的上亿级人民币 A 轮融资。

「AI 平台需要海量客户才有意义,这重度依赖内容和资本,创业公司这两项都比不过巨头,但是巨头落地众多场景和产品也非常困难,声智或许能成为平台和产品之间的桥梁。」陈孝良明白声智科技的短板在哪里——他们的产品还只能解决远场语音识别能力,但更深层次的语义识别,以及内容生态都是其尚不具备的能力。

有人并不看好声智科技至今只做一家纯粹的技术供应商的定位。陈孝良不太关注这种评价。他认为声智科技的机会在于,在 AI 的蛮荒时代站稳脚跟,成为一家关键环节上必不可少的供应商。

「苹果甚至能带动供应耳机线的公司上市,何况语音智能是个必然的浪潮。我们一直期望在国内寻找一家像苹果一样,能够带动很多供应商和合作伙伴实现 AI 价值的未来巨头。」

现在摆在陈孝良和声智科技的问题是,要不停地做出「下一个」正确决策,「控制、控制再控制自己的缺点和失误」,并且坚持到这一天的到来。

编辑:卧虫

图片来源:声智科技、视觉中国

最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。