2026「国际数学日」迎来全新「数学蒸馏挑战赛」

摘要

这是一场旨在突破 AI 逻辑瓶颈、重新定义机器推理边界的顶级赛事。

「数学似乎隐于无形,但却无处不在。」

——菲尔兹奖获得者、SAIR Foundation 联合创始人陶哲轩

「数学与人工智能的真正融合,或将是人类以科学、安全的方式加速向通用人工智能(AGI)和超级人工智能(ASI)演进的里程碑。」

——SAIR Foundation

2026 年 3 月 14 日「国际数学日」期间,在全球最早迎来「圆周率时刻」(Pi Time, UTC+14 15:09:26)的瞬间,SAIR Foundation 正式宣布启动首届数学蒸馏挑战赛(Mathematics Distillation Challenge)。

这是一场旨在突破 AI 逻辑瓶颈、重新定义机器推理边界的顶级赛事。本次挑战赛由 SAIR Foundation 发起,菲尔兹奖得主、加州大学洛杉矶分校(UCLA)教授、 SAIR Foundation 联合创始人 Terence Tao(陶哲轩),以及宾夕法尼亚大学统计学与数据科学副教授 Damek Davis 共同组织。有意参加的科学爱好者,可在 2026 年 4 月 20 号前登录 SAIR Foundation 官网进行报名,并查阅详情。

愿景:从「解决问题」到「理解过程」

当前人工智能在处理复杂逻辑时常面临「幻觉」挑战,这也是 AI 要真正融入科研、融入生活必须要解决的世纪难题。陶哲轩发表比赛启动致辞时强调,数学的精髓不在于冷冰冰的答案,而在于抵达答案的逻辑路径。

陶哲轩说:「即便顶尖 AI 能给出答案,我们往往想要更多。我们想学习如何自己解决问题。我们不仅希望帮助 AI 更可靠地进行推理,更希望将复杂的代数逻辑『蒸馏』出来,变成人类可理解、可迁移的智慧。」

此次比赛主办方核心的追问非常朴素却深刻:我们不仅仅是让 AI「给答案」或者「听起来」有说服力,而是能否帮助 AI 更可靠地进行数学推理。

核心任务:2200 万道题与「一张 A4 纸」的极限挑战

本次试点挑战聚焦于等式理论(Equational Theories),设计了一场跨越模型能力鸿沟的实验:

• 极致数据: 挑战赛提供了 2200 万道代数逻辑判断题。

• 能力跨越: 目前顶级模型在困难问题上能达到 95% 的准确率,而开源「弱模型」的表现几乎等同于随机猜测。

• 挑战目标: 参赛者需编写一份极致压缩的「策略指南」(Cheat Sheet)。陶哲轩等评审专家期待看到参赛者如何发挥创造力,「将整个代数世界的知识浓缩进一张 A4 纸大小的信息中」,赋予弱模型跨越式的推理能力。

赛程设置:从启发式策略到 Lean 证明

挑战赛分为两个阶段:

1. 第一阶段:策略与直觉(即日起 – 4 月 20 日)

参赛者可在官方「沙盒」环境测试策略,目标是看这份「策略指南」能多大程度上提升弱模型的准确率。

2. 第二阶段:验证与证明(4 月下旬)

顶尖团队将进入决赛,挑战硬核验证任务,包括提供明确的反例或使用 Lean 定理证明器提交形式化证明,彻底消除逻辑歧义。

开放合作:广邀全球学者和数学爱好者共同举办未来赛事

据主办方介绍,此次比赛不仅欢迎数学等领域科学家或者 AI 从业者参与,也欢迎更多科学爱好者参与。在 AI 时代,人人都有深入科研的可能性。

主办方相关负责人表示,这不仅是一场竞赛,更是一次全球性的科研协作。比赛产生的研究数据将向全球研究社区开放,以加速数学与人工智能交叉领域的进步。

SAIR Foundation 特别向全球数学爱好者社区发出诚挚邀请:「热忱欢迎世界各地的学者、研究机构和数学爱好者加入我们。我们希望大家不仅是作为参赛者,更是作为合作伙伴,在未来共同策划和举办此类挑战赛。通过构建这种开放、透明、可复现的竞赛框架,我们可以联合全球智慧,共同攻克数学与 AI 交叉领域的底层难题。」

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。