语音技术的民用化时代

语音技术的民用化时代

Siri 的发布掀起了语音应用的新纪元,讯飞语音云平台的升级更是为国内开发者们带来了一片崭新的市场。智能 360 联合创始人、副总裁李传丰做客第 25 期极客活动时认为,语音技术的民用化时代已经到来,语音技术未来会从简单的语音识别,向更强化的智能化语义识别迈进。

智能360 李传丰

不断成长的智能 360

从 2009 年第一次 SNS 社区的尝试和失败,到 2011 年重新聚在一起开发通话录音应用语音 360,再到智能 360 语音助手,李传丰谈到了团队波折的创业经历。之所以最终毅然选择进入了被导师李开复形容为“不适合创业者进军”的语音应用领域,一方面源于讯飞语音识别、语音合成技术的进展和开放平台策略,另一方面也得益于其团队自身在语义分析算法等方面的技术积累。

从语音发短信、信息查询,到日程管理,到聊天对话… 智能 360 想要实现的不仅仅是简单的语音控制,而是通过自然语言的适应、上下文理解,成为优于 Siri 的中文智能助理。所以在利用讯飞语音技术实现的基础语音输入和识别功能后,智能 360 更核心的特色在于其专注的中文自然语言处理功能。智能 360 采用的地图引擎为核心的自然语言算法,通过不同领域的知识库积累来促进算法的成长,用户的不断的使用正是促使系统更加智能的关键。

智能360

智能的核心

智能的核心是语音意图的理解。李传丰认为,在以 Google、Baidu 为代表的传统搜索引擎上,关健词、链接排名等元素决定了用户发现信息的优先级,最终的信息选择依然需要由用户来进行选择;而对于智能 360 希望成为的智能搜索引擎来说,其目的是通过对用户语音指令意图的理解,从知识库里面找出资讯匹配度最高的信息,得出唯一的一个用户想要的最优结果,这样可以在很大程度上解决用户在大量信息中无从进行选择的麻烦。(当然,如何保证系统推荐的结果真正的实现智能,而不是局限在某个特定的范围内,这是一个还有待攻克的问题。)

李传丰觉得,Siri 在目前阶段来讲还是一个半成品,并没有大家想象的那么智能。就像其众多俏皮的问题回复一样,Siri 表面上看起来的一些智能的东西,实际上是采用了比较讨巧用户的一种方式来进行呈现。目前美国已经有消费者投诉苹果,认为其在 Siri 推广上涉嫌过份宣扬。从用户的使用上来看,Siri 的应用场景也基本局限于日程提醒设置、信息搜索和语音输入几方面,其智能程度还远未达到理想。

即使在计算能力大幅提升的今天,人工智能的实现依然是非常困难的,李传丰将其与小孩儿进行了对比。小孩子为什么懂得少,第一点是他知识少,第二点是他的思维方式、思维能力还比较欠缺。对第一点来说,最关键的是需要给他知识,让他拼命的学习,同时在这个过程中培养全新的思维方式。李传丰提到,智能 360 的自学习框架已经搭建起来,这是 Siri 也尚没有实现的。通过用户的不断使用,这个系统会慢慢的成长,不断的推进其自然语言识别的准确度。

语音应用的市场

李传丰认同李开复的观点,好的语音应用其要求的技术积累、软硬件支持都是非常庞大的,这并不是一个适合创业者进入的领域。但他同时提到,讯飞语音云平台实际上降低了开发者进入这个领域的门槛,开发者不需要从头打造一套语音识别的系统,而大可在讯飞的平台上进行二次开发,就这个方向来说,开发者的机会还是非常广阔的,语音辅助操作、自然语言处理、第三方应用整合等领域都值得开发者关注。

谈及竞争,李传丰认为语音应用的市场现在还没有真正起来,真正的竞争还为时尚早。在现阶段,大家需要做的是共同发掘这个市场,一起把蛋糕做大。至于未来会怎么样,他觉得这个市场应该足够大,开发者一定会有自己的空间。

整理自聚熵智能联合创始人李传丰极客活动上的分享,点击观看视频

极客活动智能360语音应用讯飞语音云
下载极客公园客户端
iOS下载
反馈