【天翼开放平台】数字内容智能全识别 轻量级开发福音

摘要

天翼开发平台提供多种数字内容的智能识别能力,有效解决了轻量级应用在处理内容转换时的技术难关。

随着移动网络条件的改善、即时通讯工具功能的加强,人们之间的远程沟通方式变得越来越多元化。从最基础的文字,到现在风靡移动互联网的语音应用(如微信、啪啪等),不同信息传播形态之间的高效转换成为下一个亟需解决的问题。但是对于团队力量有限的一些开发者或创业者来说,自主研发如语音识别、图像识别之类的技术难度较大。中国电信天翼开放平台将这部分工作整合进了自身体系之内,为开发者提供了强有力的数字内容智能识别支持。

天翼开发平台的数字内容智能识别能力目前包括以下四个方面:

  • 语音合成:调用此能力可通过用户提交的文本信息,对此文本数据进行语音合成,并获取生成的音频数据,即将文本转换为语音。

  • 手写智能识别:调用此能力可通过用户提交的笔迹坐标获取该笔迹数据的识别结果,即可智能识别手写笔迹数据。

  • 语音智能识别:调用此能力可对用户提交的语音进行识别,即可智能地将语音信息转换成文本。

  • 图像智能识别:调用此能力可对用户提供的图片信息进行数字识别,即可智能地将印刷图片转换成为电子图片。

所以,即使开发者欠缺对数字内容识别的研发能力,天翼开放平台也能够帮助他们跳过这一环,迅速处理好产品的后端,从而能够把精力放到与用户直接产生交互行为的前端上。

如今很多开发者纷纷开始将目光转向微信、UC、百度等拥有亿级用户量的超级 App 上,Web App、轻应用等概念随之兴起,借助这些平台进行轻量级开发成为创业者青睐的方式。但这些平台本身主要提供的是渠道方面的支持,当开发者面临需要处理多种数字内容转换的场景时,轻量级开发原本具有的优势就会因技术问题被削弱。

以微信为例,其产品本身的特性使得用户习惯于进行语音交互。但并不是所有开发者都具有一直人工客服团队。此时通过调用天翼开放平台的语音识别能力,就能够在后台将用户表达的语意转化为文本并进行匹配分析,从而可以回复出用户希望获得的答案。

在移动终端逐渐普及之后,人们走在路上不仅要用眼睛去看,用耳朵去听的需求也逐渐浮出水面,市面上逐渐兴起的各种电台类应用就是例证。天翼开放平台的语音合成能力(文本转语音)在涉及文章阅读、外文单词拼读的功能上有着广泛的应用场景。在搜狐新闻客户端里,用户就可以通过点击每条新闻上面的虚拟播放按钮,让客户端为自己读新闻。

此外,随着整个行业对身份认证和安全系数要求越来越高,对用户身份的验证成为未来的重要环节。用户的笔迹、签名、照片、扫描证件等都会成为个人信息的一部分。这些内容如何准确高效地以数字形式保存下来?手写和图像的智能识别能力将是一片蕴藏丰富的蓝海。

目前天翼开放平台的语音智能识别能力调用次数已超过一万,其他能力也都达到五千次左右。未来天翼开放平台必将会成为重要的数字内容输入输出的枢纽。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。