
在电话客服场景里,用户和机器人交流的过程中,经常会出现沉默、打断机器人、噪声等情况,机器人在应对这些异常情况的时候,需要语音和语义理解技术进行处理,才能实现用户和机器人的流畅交谈。而这些能力的获取与应用,也是企业智能对话项目落地过程中需要解决的难题之一。
在电话客服场景里, 用户和机器人交流的过程中, 经常会出现沉默、打断机器人、噪声等情况, 机器人在应对这些异常情况的时候, 需要语音和语义理解技术进行处理, 才能实现用户和机器人的流畅交谈。而这些能力的获取与应用, 也是企业智能对话项目落地过程中需要解决的难题之一。
为此,UNIT 带来了全新的语音语义一体化解决方案, 帮助企业解决语音交互过程中的难题。
【电话客服场景下语音语义一体化解决方案】
语音语义一体化是针对电话客服对话场景的技术方案, 可用于呼叫中心智能客服等业务。整个方案包含以下内容:
(1) 降低集成开发成本
提供语音识别、语义理解、对话流程控制、知识库、语音合成的打通方案, 全双工对话能力, 一体化的部署方案, 省去开发者对各环节自行调用、拼装的学习成本以及二次开发成本。
(2) 标准协议快速接入
提供基于 unimrcp 框架开发的 mrcpserver 服务接入包, 通过标准协议适配不同呼叫中心设备 (主流的 freeswitch、avaya、及基于 mrcp 标准协议自主研发的呼叫中心设备)。
(3) 场景定制服务提升效果
方案中自带基于百度大脑呼叫中心下的通用 ASR、语义纠错, 打断策略,TTS 模型, 也可以基于开发者的业务场景, 提供模型定制训练服务, 定向提升业务准确率。
(4) 极少量开发, 轻松实现对话流程
提供 Taskflow 配置管理能力, 开发者可在梳理业务流程后, 通过少量代码快速配置对应的对话流程, 后续可直接零代码在 UNIT 平台上进行拖拽式配置。
【语音语义一体化方案解读】
(1) 语音识别 ASR
采用领先的百度语音技术, 实时将音频流转识别出文本, 并自动识别断句。
(2) 全双工对话能力
建立通用机制, 组织多模块协同工作, 实现双通道数据 (文本、事件信号) 实时分发及处理。
(3) 纠错
根据场景相关词汇生成纠错候选, 利用 GBDT 模型对获选打分排序, 最后通过 beam search 解码出最优纠错结果。
(4) 打断
采用分类模型实现, 判断是否满足打断条件, 并下发打断信号, 可支持用户自定义语料的模型训练。
(5) 静默及反问
在设定时间内用户未回复情况下, 机器人可自动反问。可支持用户对时间条件、机器人反问话术进行配置。
(6) 挂机、转人工
定义标准事件信号:挂机、转人工。用户可通过配置、或简单二次开发完成判断条件的设定。
(7) 对话理解
基于 UNIT 强大的语义理解能力, 从实时文本中, 解析用户意图。
(8) 对话逻辑引擎
以可编程的方式构业务建对话逻辑。
(9) 语音合成 TTS
基于深度神经网络技术, 提供高度拟人, 流畅自然的语音合成服务, 便于应用、设备开口说话, 更具个性。
【如何获取语音语义一体化能力】
开发者可以进入 UNIT 官网——解决方案——语音语义一体化方案页面, 了解技术详情并体验真实对话样例。https://ai.baidu.com/unit/v2/static/voice
1、方案了解
2、真实对话样例的体验
如果您的产品或项目需要使用语音语义一体化方案, 请在上述页面下方点击「联系我们」。
点击阅读上一篇相关文章:
百度大脑 UNIT3.0 解读之对话式文档问答——上传文档获取对话能力
https://www.geekpark.net/news/246212