腾讯搜狗输入法上线「声文互转」, 助力听障群体「听说」无碍

摘要

5 月 19 日是第 11 个全球无障碍宣传日, 在中国聋协指导下, 腾讯搜狗输入法开发上线了无障碍「声文互转」功能。

5 月 19 日是第 11 个全球无障碍宣传日, 在中国聋协指导下, 腾讯搜狗输入法开发上线了无障碍「声文互转」功能, 为听障人群在聊天、听课、会议、视频、直播等场景提供语音转文字、文字转语音、悬浮字幕、背景音识别等服务, 帮助听障人群在日常生活中自由「听说」, 更平等地享受科技带来的便捷。目前该功能已在 iOS 和 Android 端上线, 更新至最新版本即可使用。

在对话场景下, 听障用户可以将对方的说话内容「听」出来, 点击页面上的「麦克风」按钮, 即可开始语音识别, 实时转成文字显示在屏幕上, 该功能还具备多语种及方言识别能力, 支持中英文和 11 种方言识别 (粤语、四川话、河北话、天津话、东北话、南京话、武汉话、西安话、贵州话、济南话、河南话)。在实时语音识别过程中, 如果出现了掌声或笑声, 声文互转功能也会进行识别, 并在屏幕上方出现掌声或笑声动画效果, 让沟通氛围更真实可感知。

听障用户想要通过声音表达, 只需在输入框中输入文字, 点击「语音播报」按钮, 即可将已输入的文字转成语音并自动播放。为了让声音表达更丰富、个性,「声文互转」运用语音合成技术, 提供了不同性别、年龄段、风格的 8 种语音播报音色, 用户可以根据自己的喜好、对话场景、沟通对象随时切换。如果语音播放过程中, 对方有内容未听清听懂, 点击正在播放的语音气泡可以暂停, 再次点击后即可重新播放。

为了让听障人群在视频、直播等场景下拥有更好的体验,「声文互转」还加入了「悬浮字幕」模式。开启悬浮模式后, 语音识别的结果会以半透明字幕条的形式悬浮在视频、直播等软件的上层, 将软件播放的语音实时转化为文字, 并自动滚动显示。目前,「掌声笑声识别」和「悬浮字幕」, 暂仅支持 Android 系统。

无障碍输入是搜狗输入法长期关注和支持的领域。2015 年搜狗输入法推出视障输入, 为视障群体提供了完整的输入解决方案;2019 年, 推出点点输入, 面向只能使用鼠标输入的肢体障碍群体;2021 年推出长辈输入, 提升中老年人的手机使用体验;2021 年推出了眼动输入, 让渐冻症类用户通过眼球转动和凝视操作电脑输入, 并联合信息无障碍研究会、全国残疾人用品开发供应总站共同发起「众声」无障碍输入公益计划, 向全行业免费开放视障输入、肢障输入、长辈输入、OCR 读图、AI 手语翻译等技术解决方案。

来源:中国网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。