语音导航互联网

语音导航互联网

海豚浏览器创始人兼 CEO 杨永智在第 25 期极客活动上表示,对苹果等大厂商来说,其服务难以覆盖到每个细分市场,对创业者来说,这是不容错过的宝贵的市场机会。就浏览器来说,目前语音技术在导航、搜索等方面有很多价值可以挖掘。

海豚声纳的意义

有人会说,既然 Siri 都有那么多的功能了,其他应用还有必要做语音吗?杨永智认为,Siri 确实是语音应用的一个很好的开始,但其问题在于:人们将 Siri 当作了一个真实的人来进行对话和交互,苹果本身的宣传也刻意表现了这一点,但其实际表现离人们的期望还很远,无法识别的情况频频出现,其人工智能远没有到成熟的地步。同时,苹果不可能在每个特定的领域都做得非常完美,浏览器正是这样一个领域。

如果加入语音功能,到底是要做一个像 Siri 那样的不成熟的智能引擎,还是先尝试做一个实用的辅助工具,海豚浏览器选择了后者。从用户来讲,其使用浏览器进行网址导航、搜索等常见操作的时候,由于受到手机的限制,在输入交互方面依然比较麻烦,语音技术正好非常适合这一应用场景,海豚声纳正是想要解决这个问题而生。

由于主打自然语言和上下文识别功能,Siri 在界面交互方面进行了刻意的最简化,希望用户能够以最习惯的说话方式来进行交互,如果能够实现理想的效果,这将是一个绝佳的用户体验。但就目前来说,由于智能程度还不够,这一设计在用户引导方面的缺乏,造成了用户在使用时往往不知道该说什么。对于以指令为核心的海豚声纳来说,其界面采用的指令标签云的形式让用户一启动这个功能,就可以看见各种可以使用的语音指令,在一定程度上解决了用户引导的问题。杨永智提到,海豚虽然并不是在国内首家推出语音控制功能的浏览器,但在指令智能识别、界面设计等方面应该是做的最好的,而摇一摇启动、手势语音控制相整合的交互方式也为用户带来了特有的便利。

语音技术的应用场景

用户数据显示,海豚声纳的中文版用户使用比例远远高于英文版,这是海豚浏览器之前没有想到的。这其实正好说明了在手机上录入文字的麻烦,这也正是语音技术在移动互联网时代开始获得流行的原因之一。

杨永智觉得,如果所有的手机都能够在语音领域去发力,用户逐渐开始越来越多的使用语音的话,给搜索带来的流量还是很大的,而这也会带来更多的商业模式上的机会。例如用户想要买东西,浏览器在接受语音输入命令后,将用户导航到淘宝进行购买;又如用户想要查找一个好友的信息,通过语音命令,浏览器为用户打开好友的 Facebook 个人页面… 粗浅来看,除了网址导航、除了搜索,语音技术未来在跟如电商、SNS 等很多很多特定领域的服务结合起来,一定会有非常广阔的空间去探索。

从语音到文本其实并不是一个特别难的东西,关键是需要大量的数据去训练这个系统,讯飞在这方面已经拥有了巨大的技术优势。杨永智的观点是,语义识别远比语音识别难得多,到目前为止,他尚没有发现发现比较优秀的应用。但未来在这个领域应该会看到越来越多的进展,也许只要到那个时候,真正的 Siri 才会出现在我们的眼前。

创业者困境

今天中国所有的互联网公司都面临着巨头的威胁,这是中国创业者面临的无奈的现实。杨永智的建议是,创业公司必须“先存活下来,找到自己差异化的点”,然后再继续扩大自己的市场,而不是一来就想要颠覆整个行业。此外,他还建议创业公司应该尝试更多的走出国门,重视国际化,海豚浏览器正是很好的一个例子,许多成功的游戏开发者也同样采用了这一策略。

另中国创业者头疼的是,他们面临的障碍还不止巨头一个因素。在国外,应用市场的游戏规则是非常透明的,渠道也相对比较单一化,一款产品找到好的点宣传,利用应用排名与口碑就可以导致产品的爆发。但在中国,渠道的分散化非常严重,以 Android 为例,包括市场、社区、论坛在内的下载提供者达到了近 400 家,更不用说形形色色的推广联盟、刷机 Rom、手机厂商和运营商,一般的创业者和小型创业团队很难应付这么多的渠道。更雪上加霜的是,国内同质化的产品太多、竞争太激烈,导致一款产品想要脱颖而出很困难。杨永智觉得,这对中国的创业者来说是一个非常大的挑战,也是中国互联网真正想要健康发展需要切实解决的问题。

整理自海豚浏览器 CEO 杨永智 在极客活动上的分享,点击观看视频

创业者语音控制海豚浏览器极客活动
下载极客公园客户端
iOS下载
反馈