揭秘中文版三星 Bixby:语音技术自研,和有些「疯狂」的产品思路

摘要

Bixby 是一个集合了语音、视觉和平台功能的产品。

三星终于在中国市场完整展示了自己的 AI。

Bixby 的使命很重大,不论是对三星和行业而言,还是对数亿的现有用户来说都是,因为三星是目前全球 ICT 产业最关键的玩家,也是全球最大的家电和手机公司。

一面是中文版 Bixby 的姗姗来迟,一面是全球科技圈对 AI 的疯狂追逐,三星在人工智能上的能力究竟如何,我们终于在一个满血的中文 Bixby 发布后有了答案。


三星电子中国研究院院长张代君告诉极客公园:「Bixby 不只是一个语音助手,而是一个人工智能平台。」而透过对三星电子北京研究院的探访,我们了解到了一些 Bixby 中文版背后的故事。

Bixby 的语音技术是完全自研的

中文版 Bixby 正式发布之前,张代君和三星电子中国研究院的工程师们最困扰的一个来自外界的问题是,三星是不是没有人工智能。

客观的说,虽然中文版的 Bixby 姗姗来迟,但三星手机上的「人工智能」已经很多年了。三星是在手机上做「生物识别」最激进最全面的公司,指纹识别、虹膜识别和人脸识别如今同时出现在了 Galaxy 手机上,它们的背后充满着 AI。


「有没有人工智能」是「人工智能」和「AI」占据了所有的头版头条之后出现的奇怪问题,一位三星电子中国研究院的工程师对极客公园说:「我们十几年前就在研究语音识别,那时的模型很原始,跑一遍数据经常需要两三个月,三星电子中国研究院一直在进行着研究,最近几年利用先进的模型进展很快。这在研究院内是很常规的事情,没想到外界大环境一下子对人工智能这么追捧。」

我们再三求证,中文版 Bixby 的语音技术并没有选择和讯飞、搜狗、出门问问等本土公司合作,是完全自研的。


三星电子中国研究院的工程师们采用了目前全球最先进的模型去开发中文的语音识别和语义理解,但还是被折磨得很痛苦,张代君院长现在在内部不再被叫做「张院长」,而是「Mr. Bixby」。

Bixby 是一个集合了语音、视觉和平台功能的产品,而在最新发布的版本里,语音是主角。张代君院长告诉极客公园,Bixby 和 Siri、Alexa 最明显的区别有四个:功能全覆盖,认识容忍,学习型 AI 和「说人话」。

「疯狂」的产品思路

张代君院长描述的 4 个特点最终汇聚成了一个事实:三星在 Bixby 上选择了一种近乎「疯狂」的产品思路。


只要能点的全都能说,这样的一句话概括可能还是有些抽象,但确实是 Bixby 最不一样的地方。差别可以集中体现在一些连贯的复杂操作上,比如「打开微信给老婆发 100 块钱红包并说辛苦了」,我们可以在 Bixby 上看到迅速连续的操作过程,最终到达信息已经完整的红包界面,目前除了 Bixby,没有任何其它的「助手」可以做到这一点。

「Bixby 首先要解决的问题是人机交互的痛点」,张代君院长这样告诉我们。

大家都很难想象,一台三星 Galaxy 手机上的基础功能超过了 7000 个,现在的智能手机都太复杂了,而人们能熟练掌握的只占其中很小的一部分。


我们可以对 Bixby 说,「把今天拍的照片单独新建一个叫做回忆的文件夹」,这其中有很复杂的语义理解,有图像识别,还有人机交互 voice UI 的新尝试。Bixby 是目前所有同类产品里在打通软硬件上做得最彻底的,是一个渗透到了产品最细微处的平台。


目前我们看到的 Bixby 中文版更多的是一个强大的语音助手,不过张代君院长向我们透露,2.0 版本的 Bixby 正在开发过程中,其中会加入声纹等更多的生物识别,Bixby Vision 会进一步得到强化,那时用户会更明确的感受到 Bixby 究竟是什么。


而根据极客公园得到的消息,三星并没有打算把 Bixby 做成一个封闭的产品,它在将来会开放给更多的合作伙伴,第三方的硬件产品上也可以搭载 Bixby。到那时,三星在 Bixby 上有些「疯狂」的产品思路会得到更大范围的释放。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。