更「主动」和「乖巧」的 Siri,能成为语音交互的最新发动机么?

摘要

在我们都以为作为语音助手的 Siri 正被亚马逊和谷歌远远地甩在身后时,苹果却已经对 Siri 有了更深远的思考。

被诟病「不好用」的 Siri,曾一度因为 HomePod 的发布迎来更加糟糕的风评。

作为「智能音箱」,HomePod 的音质收获了几乎所有人的一致赞美,但代表其「智能」这部分的 Siri 却表现欠佳。在亚马逊 和 Google 两家巨头将智能语音助手之争演变成军备竞赛的这两年里,Siri 始终没有什么存在感。相比 Alexa 和 Google Assistant,Siri 常常被用户吐槽「听不懂,做不到」,整体的指令识别成功率偏低。同时,Siri 的第三方开发的生态也不如 Alexa 和 Google 那么丰富,用户也很难通过向 Siri 下达指令来获取第三方服务。

但这一次,苹果不想再让用户久等。就在各种批评声音还未散去之时,苹果在 WWDC 18 上针对 Siri 交出了一份答卷。苹果为 Siri 体系带来了一个全新的自动化工具:Shortcuts,这相当于给 Siri 配上了一台全新的发动机。Shortcuts 让用户可以将指令和动作依照自己的需求绑定起来,也让 Siri 可以更细致地获知用户的需求,并且主动给出推荐。通过 Shortcuts,苹果希望让 Siri 能听懂用户的指令,接入到尽可能多的服务,最终融入丰富广阔的 iOS 开发生态。


在 Siri 和第三方 App 间搭起一座桥

这并不是苹果第一次为 Siri 的开放费尽心思。

在 2016 年的 WWDC 上,苹果就发布了 SiriKit。这是苹果第一次将 Siri 开放给第三方开发者,希望用户可以借助 Siri 访问更多第三方服务。开发者可以基于自己的 App 功能定义指令,然后苹果会将这些指令集成到 Siri 里,当用户发出的语音指令中包含正确的触发词时,App 内的功能就会被触发。

但这个功能一直存在着一个隐患。自然语言里的关键词极为有限,如果少数的重要关键词比如「叫车」、「订餐」被少数的开发者所把控,这是会比「域名争夺」更可怕的一件事。因此,苹果在此事上一直保持着谨慎的态度。针对 SiriKit,苹果最初仅仅开放了包括短信和通话在内的 6 类服务,允许开发者接入。虽然苹果后续又陆续开放了一些服务,但真正得以接入 SiriKit 的 App 数量少得可怜。另一方面,即便是接入了 SiriKit 的 App,也因为开发者定义的指令不能广泛契合大多数用户发出语音指令的方式,很难让用户流畅使用。

不过,苹果并没有放弃这方面的努力,并且在仔细思考,如何在 Siri 开放的过程中利用好自身优势。去年 3 月,苹果宣布收购 Workflow。基于泛化的网址系统(包括一切 url 和 url scheme)。这个 iOS 上的著名自动化 App 可以让用户可以将不同的指令、动作串联起来,编写自动化操作。

在被苹果收购之后,iOS 商店里 Workflow 的价格从之前的 18 - 45 元人民币变为免费,整个开发团队也得以加入苹果。当时外界普遍认为,苹果是希望基于 Workflow 来为 iOS 打造一款类似 macOS 上 Automator 的生产力工具。但苹果显然着更深层次思考,在收购 Workflow 之后,苹果将整个团队整合进了 Siri 团队,在过去的一年多时间里,基于 Workflow,这个新融合的团队开发出了 Shortcuts。

         在智能钥匙扣的 App 里,让钥匙扣响铃就变成了一个 Intention。

脱胎于 Workflow 的 Shortcuts 在「第三方服务接入」这件事上获得了一个质的飞跃。任何开发者都可以在自己的 App 内定义一些名为「Intention」的动作:比如用户用星巴克 App 点咖啡,星巴克的开发团队就可以将「点咖啡」这个动作定义为一个 Intention。而这些 Intention 最终都可以被用户手动加入到 Siri。App 开发者也不再需要去思考「用户会说什么关键词来触发我的服务」,而是只需要将用户在自家 App 上进行的动作总结、精炼出来,接入到 Shortcuts 就行了。

Shortcuts 使任何 iOS 开发者都可以轻松地将自己的 App 接入 Siri,满足用户的需求。它相当于一座桥梁,将丰富而广阔的 iOS 应用生态,和不够完善的 Siri 进行了一种连接。

当 Alexa 和 Google Assistant 正各自试图将自家的语音助手打造成一个独立的平台、并拉拢新开发者时,苹果正试图利用 iOS 本身的优势来完成一次超越。


Siri 的主动推荐有了更丰富的细节

2016 年,随着 iOS 9 的问世,苹果推出了「Proactive Siri」(Siri 主动推荐)功能。苹果希望 Siri 不仅仅是一个被动接受并执行指令的「语音助手」,而是想让它成为一个能主动预测用户需求的智能私人助手。藉由 Siri 主动推荐功能,用户在特定的地点和时间,会在多任务界面看到推荐打开的 App;连上车载蓝牙之后 iPhone 会自动给出回家的路线规划和行程预测;Siri 会自动识别规律性日历项发生的地点,提前预测路况,提醒你该出发了;插上耳机之后 iPhone 会自动推荐打开你常用的音乐或视频 App……

但就过去两年,就在 Google Assistant 和 Alexa 高歌猛进时,Siri 的主动推荐功能并没有成为 iOS 下的「杀手级功能」,甚至都不怎么为人所知。背后的一个重要原因是,其针对第三方 App 的支持仅仅只能停留在「推荐用户打开 App」这样一个很浅的层面上,它既无法从 App 中获取到更深层次的信息,也无法一步深入到 App 内的某个行为上。其中真正有意义的深度推荐都是基于苹果自家 App 的,这就大大限制了 Siri 主动推荐的发挥空间。

现在,苹果希望 Shortcuts 的出现彻底改变这个困境。


         Siri 会自动分析你的需求给出动作推荐

在 Shortcuts 中,由开发者定义的「Intention」将会被整体接入到 Siri 主动推荐中。开发者可以定义这个动作的关键参考要素,比如时间、地点…… 这样 iOS 就会在后台对用户进行这些动作时的关键参考要素进行观察,比如用户每天早上都会用某个 App 点咖啡,那么 Siri 就会以通知的形式在早上主动推荐用户执行这个动作,用户只需要在锁屏界面点击一下,App 就会接到指令,自动帮忙点好咖啡。同时,这些 Shortcuts 也会在 Apple Watch 的 Siri 表盘上显示,并可以在智能手表上执行。

这套机制让 Siri 可以更精细地洞察用户的需求,提供更多方便的快捷方式。更「贴心」的一点是,苹果在进行这一系列创新时,已经自觉站在了用户那边,它周全的考虑了用户隐私的问题:这些和用户需求相关的数据收集和处理全部都由 iOS 在本地执行,开发者并不能获取到详细的用户行为数据。


让用户自己来训练和教导 Siri

除了自动推荐,苹果当然也没忘了 Siri 最初的起点——语音控制。

在 iOS 12 之前,人们对 Siri 最大的不满,并非在于 Siri 听不懂他们在说什么——事实上,Siri 大部分时候都能够将声音比较准确地转换为文字。但将不同用户心中各不相同的自然语言习惯转换成正确的命令,才是 Siri 一直没有跨越的门槛。

在 Twitter 上,著名科技评论人莫博士曾经毫不留情的吐槽过 Siri 理解指令的能力:在控制播放音乐时,用户必须按照标准的句式,准确地说出歌名、专辑名、歌手名,Siri 才能正确地理解你想听的是什么,否则就很容易表现成「人工智障」。

自然语言处理是计算机领域几十年来的难题,也是智能语音助手想要真正进入更复杂场景时必须跨越的巨大障碍。现在,苹果在这件事上做出了一个关键选择。它不再完全让 iOS 团队或第三方 app 开发者来决定 Siri 对自然语言的理解,而是把训练和教导 Siri「听话」的权利交给用户。

也就是说,用户现在可以将各种 app 的动作编写成 Shortcuts,然后自己设置一个触发词来执行 Shortcuts。一个典型的场景是,用户可以将「打开家里的空调」、「向家人发一条短信告知自己晚上回来吃饭」、「叫一辆回家的 Uber」三件事连在一起编写成一个 Shortcut,将 Siri 关键词设置成「下班回家」,在晚上离开办公室前,对 Siri 说一句「下班回家」,Siri 就会自动完成开空调,发短信以及叫 Uber 三个动作。


我们使用手机的方式是很复杂的,即使业界高喊着 voice-first,语音交互真正能接管的,还是很少的一部分场景。而 Shortcuts 要做的,就是把那些具有一定复杂性但有规律可循的任务,让用户去自定义设置程序并教给 Siri。进而把一个非常复杂的流程变成一句语音指令就可以搞定的事。用户不再需要去「不断尝试」什么样的指令是 Siri 能听懂的,而是可以像做一个 Workflow 一样把很多不同的动作变成一种「一触即发」的体验。

这种机制让 Shortcuts 可以在 Apple Watch 和 HomePod 上被轻松触发,Apple Watch 和 HomePod 会将执行 Shortcuts 的指令发送到 iPhone。同时也让多语言的 Siri 变得有可能。对于中国用户来说,需要用到多语言的情况还是挺常见的,而通过 Shortcuts,类似「用中文 Siri 无法控制播放英文歌曲」的问题都可以通过自己设定 Shortcuts 来解决,你可以用中文指令去控制播放英文的歌单、播客,也可以用英文指令去触发中文 App 里的订餐、打车以及发短信。

在我们都以为作为「语音助手」的 Siri 正被亚马逊和谷歌远远地甩在身后时,苹果却已经对 Siri 有了更深远的思考。很显然,苹果正希望 Siri 超越语音助手的定位,成为一个能够听懂指令,且能够主动理解用户需求的「综合性 AI 助手」。只不过,想要达成这个目标很困难,在过去的几年里,苹果的尝试没有取得太多成功。

而 Shortcuts 的问世,让开发者和用户被放到了各自合适的位置上,将一个远大却有点虚无缥缈的目标,转化成了一种更实际的应用机制。它让更多的第三方服务有机会轻松接入 Siri,也让 Siri 能够调用 App 内更深层次的动作,并且让用户能够主动控制这件事。

拥有这样一个全新的发动机后,Siri 需要达成的目标不再「神奇」,已经开始变得更加「实际」。这或许是我们在 iOS 12 中看到的最令人兴奋的更新之一。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。