有道 14B 低成本轻量模型「子曰 3」开源,数学推理性能超越大模型

摘要

6 月 23 日,网易有道宣布正式开源「子曰 3」系列大模型的数学模型(英文名称 Confucius3-Math)。

6 月 23 日,网易有道宣布正式开源「子曰 3」系列大模型的数学模型(英文名称 Confucius3-Math)。这是国内首个专注于数学教育,可在单块消费级 GPU 上高效运行的开源推理模型。其在一系列数学推理任务中取得当前最优性能,超越了许多规模更大的通用模型。该模型的开源,为教育领域提供了低成本、高性能的 AI 解决方案,推动大模型技术向教育领域加速渗透。

低成本高性能,助力教育公平

据悉,「子曰 3 数学模型」在解决国内数学问题任务中展现出了显著优势。其通过大规模增强学习以及一系列的创新算法,推理性能约为 DeepSeek R1 的 15 倍。

测试数据显示,在 CK12-MATH、GAOKAO-Bench(Math)、MathBench(K12)、MATH500 等数据集上,14B 轻量级的「子曰 3 数学模型」各项得分均高于 DeepSeek-R1 等通用大模型。在 GAOKAO-Bench(Math)这一基于高考数学题的大模型评测框架中,「子曰 3 数学模型」的得分高达 98.5 分。

除了出色的性能,「子曰 3 数学模型」的成本优势同样显著,其在消费级 GPU 即可运行,大大降低了教育场景的 AI 应用门槛。

事实上,中小学教育长期面临教育资源不平等、个性化辅导资源不足、复杂题型讲解成本高等痛点,而教育大模型能有效辅助提升学习效果,但高性能大模型的构建和部署成本却非常高昂,许多低收入地区难以负担。

针对这一问题,「子曰 3 数学模型」实现了部署性能的极致突破,服务成本每百万 token 低至 0.15 美元,远超目前大多数通用大模型的成本效益。这意味着更广泛的普通教育机构和开发者都能以低成本部署专业级的数学 AI 应用。

「对于行业而言,『子曰 3 数学模型』证明了在低成本情况下,在特定领域构建强大推理模型的可行性,为垂类推理大模型的研发与应用提供了重要参考。」网易有道首席科学家段亦涛表示。

「AI+教育」加速进化,子曰释放教育大模型应用价值

自 2023 年 7 月推出国内首个教育大模型「子曰」以来,网易有道在「AI+教育」领域加速进化,持续释放大模型在教育行业的应用价值。

从「子曰」大模型在一年内快速推出 10 余个垂直应用,到今年初发布国内首个输出分步式讲解的推理模型「子曰-o1」,再到如今「子曰 3 数学模型」正式开源,网易有道充分结合应用场景进行模型迭代和优化,持续推动教育大模型技术创新和应用落地。

此次「子曰 3 数学模型」发布及开源,标志着「子曰」大模型系列在轻量级模型推理能力上实现了又一重要突破,也使得有道在教育大模型领域长期积累的技术成果能够共享给更多的开发者和从业者,构建起协同发展的行业格局。

段亦涛强调:「AI+教育的终极目标不是替代教师,而是让技术成为教育公平的杠杆。希望『子曰 3 数学模型』的开源能够吸引更多开发者加入,共同探索推理模型在教育领域的应用价值。」

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。