华为小艺 AI 竞赛 Agent 首战国际数学奥林匹克大赛(IMO)荣获佳绩!

摘要

在 2025 年国际数学奥林匹克竞赛(IMO)官方的特别邀请下,小艺 AI 竞赛 Agent 亮相本届全球顶尖的数学赛事。经过三天的激烈角逐,小艺 AI 竞赛 Agent 成功攻克6 道难题中的 5 道,以34 分的优异成绩摘得银牌,距离金牌分数线(35 分)仅 1 分之差。这一历史性的突破,标志着华为 AI 的逻辑推理能力达到了一个新的高度。

在 2025 年国际数学奥林匹克竞赛(IMO)官方的特别邀请下,小艺 AI 竞赛 Agent 亮相本届全球顶尖的数学赛事。经过三天的激烈角逐,小艺 AI 竞赛 Agent 成功攻克6 道难题中的 5 道,以34 分的优异成绩摘得银牌,距离金牌分数线(35 分)仅 1 分之差。这一历史性的突破,标志着华为 AI 的逻辑推理能力达到了一个新的高度。

IMO 主席 Gregor Dolinar 教授对华为 AI 的表现给予了高度评价:「华为 AI 提交的答卷获得了 34 分(满分 42 分),这是一个了不起的成就。(The Huawei AI scripts received a grade of 34 out of 42, which is a remarkable result.)」

不止于答题:小艺AI 竞赛 Agent 展现专家级解题艺术

与传统模型追求解题套路不同,小艺 AI 竞赛 Agent 在解题过程中展现了接近顶尖解题方式的创造力和严密性:

专家级推理能力:小艺 AI 竞赛 Agent 完美攻克第 1 至第 4 题,均获满分(7 分)。其论证过程严谨、逻辑自洽、可读性强,此外在第 3 题中还灵活运用了「升幂定理」等技巧,展现了深厚的数学知识储备。值得说明的是第 5 题,评审组确认,尽管 Agent 因对平局情况的表述存在细微瑕疵被扣 1 分,但其核心思维过程已完整包含了对该情况的严谨证明。这表明,它实际上已具备了解答该题所需的全部数学能力。

闪耀的解题灵感在第 2 题的证明中,小艺 AI 竞赛 Agent 精准预测并添加了唯一一个辅助点,便完成了整个复杂证明的生成。其解法之高效、思路之凝练,显著优于已知的公开解法。

接近完美的思考深度:第 1 题的解答思路流程完整,清晰简洁,对于 n=3 的情况讨论充分,归纳过程严谨;同时在第 4 题的解答中对所有情况讨论完备,证明的结构层级分明,易于理解。

技术揭秘:驱动巅峰表现的「双脑」协同架构

小艺 AI 竞赛 Agent 的卓越表现,源于其创新的「自然语言大模型 + 形式化证明」协同架构。这套系统如同一个拥有「左右脑」的数字大脑,将人类的直觉创造与机

器的严谨验证无缝融合。

1、思维风暴与「AI 同行评审」:孕育创造性解法

面对难题,小艺 AI 竞赛 Agent 首先通过并行采样生成海量、多样化的解题思路,如同进行一场「思维风暴」。随后,启动独特的「AI 同行评审」机制,让不同的 AI 模型互相审阅、辩论、评分,从而筛选出最优的思路路径。这一过程还会融合形式化证明的反馈,指导 AI 模型进行多轮自我修复与迭代优化,极大提升了模型攻克精英级难题的创造力。

2迭代式多层级证明:构建严密的逻辑闭环

为克服高复杂度数学证明严谨性的挑战,华为小艺团队设计了迭代式多层级并行证明系统。该系统首先将复杂的证明目标分解为树状的多层级子问题,然后由形式化证明模型自下而上地对每个子节点进行大规模并行验证。一旦某个环节证明失败,具备反思和自我修正能力的模型将立刻启动修复流程,直至整个逻辑链条完美闭环。

里程碑与新起点:共探 AI 与教育的未来

此次赛事的成果,不仅是华为 AI 发展的重要里程碑,更充分地证明了基于大语言模型(LLM)的多 Agent 协同系统在解决高阶数学问题上的强大潜力。

与此同时华为小艺团队也意识到,当前系统在面对极高复杂度的数学问题时(如本届 IMO 第 6 题)仍有局限,未来将会继续提升小艺的抽象推理与问题建模能力,持续向高阶数学推理探索。

据悉,小艺 AI 竞赛 Agent 的核心能力,未来将逐步赋能于小艺教育 Agent。华为小艺团队或将以白名单机制,优先向数学及 AI 领域的专业研究者开放,旨在共同推动智能解题方法论的创新,让顶级的思维能力普惠每一位学习者。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。