钉钉联手通义实验室发布 Fun-ASR 语音识别大模型，支持企业专属模型定制训练

8 月 22 日，钉钉、通义实验室语音团队宣布，联手推出新一代语音识别大模型 Fun-ASR，能听懂家装、畜牧等十大行业黑话，并支持企业专属模型定制训练。基于双方深度共建，Fun-ASR 能够准确转写各种语音信号，具备识别多行业术语、不同语言与口音的能力，也能结合上下文信息实现更精准的转录，并支持企业专属模型定制训练，让模型更懂企业场景。

目前，Fun-ASR 已被集成进钉钉的多个功能模块，包括会议字幕与同传、智能纪要、语音助手等，旨在构建一套稳定、高效、易扩展的语音识别基座，尤其适用对企业级语境理解、识别准确率有较高要求的场景。

技术层面看，Fun-ASR 语音识别大模型的核心亮点在于三方面：

其一，全面增强了对行业专有词汇的识别能力。该模型经过上亿小时音频数据的训练，结合钉钉多行业客户的真实场景共创，能够准确理解互联网、科技、家装、畜牧、汽车等十多个领域的专业术语。

实测数据显示，Fun-ASR 在保险行业的准确率较以往提升 18%，在家装、畜牧等行业也实现了 15%-20% 的提升。针对生僻词汇，Fun-ASR 还提供企业自定义热词能力，最多可支持 1000+热词导入。

其二，结合钉钉带来了更强的上下文感知和理解能力。Fun-ASR 可结合企业在钉钉内的已有信息如通讯录、日程、知识库等，进行推理优化，有效缓解大模型造成的幻觉，提供更可靠的转写结果。该能力需经企业授权后方可生效。

其三，针对有高阶需求的企业，支持定制化语音识别模型训练。基于高效的端到端训练架构，该模型可利用企业提供的真实场景语音数据进一步做算法优化，以提升如品牌名、项目代号、产品名、人名等专属词汇的识别准确率。

以顾家家居与钉钉的合作为例，经过专属训练后，在顾家的门店销售给客户讲解产品时，该模型能够准确识别「比利时进口 Pulse 脉冲乳胶」、「独创 Sonocore 发泡工艺」等专业表述，为后续对客户需求的进一步分析提供可靠依据。

对于此次合作，通义实验室语音团队负责人李先刚表示：「我们很高兴能够与钉钉携手，共同推动语音识别技术在企业场景中的创新和应用。未来，我们将持续扩大 Fun-ASR 的数据和模型规模，不断提升大模型语音智能解决方案的可复制能力，为企业客户带来更高效、智能的产品体验。」

钉钉 CTO 朱鸿也表示，「钉钉和通义团队仅用三个月的紧密协作，就实现了 Fun-ASR 模型的成功落地，并赢得了头部客户的高度认可。这是我们迈向行业领先的一次关键突破，也将为更多钉钉客户打造专业定制大模型提供可参考的范例。」

目前，Fun-ASR 的潜力尚未被穷尽，双方将继续探索在方言识别、噪声鲁棒性、多语种支持及企业深度定制等方向的升级工作，不断提升语音转写的精准度和实用性，为更多企业业务场景的智能升级赋能。

最新文章