不仅能听还能懂:网易有道发布首个同传 Agent,重塑高频信息处理场景

摘要

当 AI 圈「养虾」热潮持续升温,Agent 理念正加速渗透至垂直应用场景。

当 AI 圈「养虾」热潮持续升温,Agent 理念正加速渗透至垂直应用场景。继开源国内首个「龙虾」后,网易有道再度加速,率先推出行业首个「同传 Agent」,并新增录音转写功能,以 Agent 能力重塑课堂与会议的信息处理效率。

近期,开源项目 OpenClaw 引发的「养虾」热潮席卷 AI 界,其背后核心在于 AI 交互范式从传统的「一问一答」向能够理解复杂意图、自主规划并执行任务的「Agent」转变。而这种变化,也悄然发生在实时翻译与语音转写等高频需求场景中。

在课堂、学术讲座或企业跨国会议等场景中,用户往往面临着极高的认知负荷:既要听懂外语,又要翻译信息,还要同步记录重点——「上课全靠录音笔,课后两倍时间回放」「听全英讲座,记笔记和听讲永远在打架」……这些真实痛点,正是传统翻译工具无法解决的。

有道此次推出的行业首个同传 Agent,正是精准切入这一场景,并新增录音转写功能,将 AI 从单一的语言转换工具,升级为一位全能的「信息处理助手」。

据了解,用户只需在有道词典/有道翻译首页点击「同传」,有道同传 Agent 便可自动完成一整套信息处理流程:识别现场语音——实时记录原文或进行目标语言翻译——同步生成带时间戳的内容,并支持用户随时补充笔记或拍摄 PPT 图片——结束后,同传 Agent 还可根据不同场景匹配生成总结内容,例如课堂知识点笔记、会议纪要或思维导图等,帮助用户快速梳理信息结构、提炼核心要点。

这意味着,用户无需再在「听讲」与「记录」之间频繁切换注意力,而将更多精力集中在内容理解本身,从而提升学习与工作效率。

【有道同传 Agent 功能截图】

这套流畅体验的背后,是有道长期积累的核心技术实力。为了在复杂真实场景中实现稳定交付,有道同传 Agent 在识别广度、准确率以及复杂场景适配性方面持续优化。

目前,该功能已支持 71 种语言、125 种口音的实时识别,不仅覆盖主流通用语言,还包括粤语、印度英语等常见特色口音,以适配更加多元的国际交流环境。同时,系统搭载远场语音识别技术,即便在大型教室或会议等相对嘈杂的环境中,也能够保持稳定识别效果。

此外,系统还针对经济、物理、计算机、数学、医学等多个专业领域进行了专项语料训练,从而提升专业术语的识别与翻译准确度,使其能够更好适配学术课程、专业讲座等复杂使用场景,翻译准确率可达 98%。

事实上,这也并非有道在 Agent 方向的首次尝试。从最近行业热议的「百虾大战」中,LobsterAI(有道龙虾)成为国内大厂首个开源龙虾,到此次发布行业首个「同传 Agent」,有道正以前所未有的速度,推动 Agent 走向真实的工作流。当 AI 开始接管信息处理的繁杂任务,效率工具的形态正在被重塑,一个「全自动」的信息处理时代已然开启。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。