微信The Voice Donor捐赠声音背后的故事

微信The Voice Donor捐赠声音背后的故事

关于微信 The Voice Donor 项目

「The Voice Donor:为盲胞读书」是由微信市场发起的创意公益活动。用户只要进入「为盲胞读书」(微信号:voicedonate)的微信账号,就可以朗读系统推送的一段文字;或者随手拿起手边的书,为盲胞朗读自己喜欢的段落。后台将收集语音文件,制成有声书,提供给盲胞收听。

微信 TVD 是如何运作的

创意从何而来?

我们先做了一个前期的调研:在中国 有 1263 万视觉障碍人士,这个数字是新加坡人口 2.5 倍,中国每天新书上架数量是 700 本,但对盲胞来说,这个数字可能是零。我们通过计算发现,以目前微信 3.96 亿月活跃用户量来计算,即使每个用户捐献一分钟也是一个非常庞大的语音库。于是我们就想,为什么不用微信的语音功能做一些有意义的尝试呢?创意就在这里产生了。

在具体打磨创意过程中我们主要遵循三个原则:打破常规、跨界融合,极简主义。微信的语音功能是移动互联网与人声的有机融合,用户拿出微信就可以成为声音的捐献者。同时我们在后台做了很多复杂的技术尝试,从而把最简单的交互呈现给用户。好的创意也带来不错的传播效果,整个一周之内就达到了千万量级的曝光。

微信 TVD 的运营和推广

好的创意是第一步,运营推广也很重要的。我们选取了盲人按摩院和闹市书店作为推广的主要试点。首先,我们了解到盲人按摩是盲人从事最多的行业,也是盲人与普通人接触最频繁的地方,所以在按摩床下设立二维码正是基于这样的考虑;其次,闹市书店是人们阅读的高关注场所,更便于随手进行阅读分享。

关于传播前期我们并没有做主动的推广,因为我们对这个创意有足够的自信,希望凭借爱心的自由流转让大家主动参与到活动中来。微信 TVD 上线时恰逢 5.18 全国助残日,为盲胞读书的项目在微信朋友圈中火了起来,进而扩散到其他的社交媒体,形成口碑传播的裂变效应。我们还会发挥腾讯平台的优势,比如联合腾讯文学给我们提供一些独家的内容资源;同时借助社会力量如专业的盲人机构收集用户的声音发放到盲胞的手里。我们希望让每个微信用户都成为一个志愿者。

微信 TVD 的技术实现方式

好的创意和运营也需要技术的有效支持。在经过微信市场与模式识别团队的技术创新打造之后,「为盲胞读书」公众号主要能够实现以下的流程:

  1. 利用语音识别,智能筛选有效声音;
  2. 自动分发,把空白段落回流,重新募集声音;
  3. 把有效声音拼接为完整的有声读物。

微信 TVD 的后台首先把一本书切分为一段一段的文本,接着会把一段文本交给多个用户录音,而后在这些录音中寻找一个最优的语音作为这段文本的最终录音。这样当一本书的每一段文字都有了录音后,系统会把每段文字对应的最优录音拼接起来,形成最终的语音电子书。

如何筛选?

我们通过对不同的语音进行打分排序,从用户提交的大量音频数据中挑选出符合有声读物制作标准的语音。系统筛选语音的原则是语音流利清晰、没有误读漏读和多读的情况。分析筛选的过程主要按照两个维度来进行:

  1. 基于时间点:通过语速、是否停顿和漏读多读,给出流利度得分;
  2. 基于置信度:检测是否错读、口音和噪音,给出置信度得分。

系统通过上述两方面的分析对一条语音给出最后的评分,随后把同一段文本对应的所有语音按照打分结果做排序,挑选出最优解作为最终采用的语音。这背后是一整套基于专业声学模型的技术手段来进行支撑。

技术尝试

未来对微信 TVD 的改进主要从这几方面展开:首先是改进分析模型,让整个后台对用户捐献的语音能够做更加详细的分析;再改进我们的算法,使整个后台运营更加智能;甚至可以引入打分评价等多种方式,给用户更多的反馈;乃至增加分享和互动模式,使捐献声音成为一种更有趣、更有意义的体验。

(本文根据腾讯微信 TVD 项目经理梅舰和模式识别工程师岳帅在 MIIC2014·极客公园公开课的演讲整理)

语音技术科技公益微信
下载极客公园客户端
iOS下载
反馈