大模型再战高考题：去年数学全军覆灭，今年竟跨过清北线!

2024 年，国内外众多 AI 大模型参加全国高考，文科表现优异而理科集体「挂科」的成绩，让外界试出了人工智能的短板。当新一届高考迫在眉睫，人们关注的焦点自然是，一年来不断升级迭代的「AI 考生们」准备好了吗？它们能否一雪前耻？

日前，国内首个教育大模型「子曰」和 DeepSeek-R1 推理模型「双引擎」赋能的有道 AI 答疑笔 SpaceOne 率先出战，与北京海淀区高三学生们一起参加了最新的高考二模同题测试，引起外界普遍关注。

有道发布的视频显示，当有道领世老师们拿到一份特殊的密封答卷时，他们并不知道这位「考生」的来历，一切阅卷流程均按照标准评卷规范进行。最终，这份答卷拿下了语数外 697 分的高分（语文、数学、英语、物理、化学、生物组合），不仅理科全部获得优异成绩，其中生物满分，数学接近满分！

清华大学硕士、英语阅卷老师赵晨曦赞叹道：「即便放眼全国的高考，这都是一份绝对的高分卷！」语文阅卷老师姜博杨则说：「这套题的难度比较大，从作文看得出来知识储备很深厚，是一个标准优等生的议论文。」

清华大学资深物理主讲、物理阅卷老师李楠则判断说：「在北京卷用题新颖的前提下，这个『孩子』的表现还是非常不错的，他可能是搞过物理竞赛吧？」北京师范大学硕士、地理阅卷老师杨翌猜测：「我觉得这应该是在海淀区排名非常靠前的一位『学生』」。

语文 126、数学 145、英语 141、物理 92、地理 93、生物 100、政治 84、历史 87、地理 93……一连串高分，让人看到了这位特殊「考生」超强的全科综合实力。如果选取语文、数学、英语、物理、化学、生物组合，参考北京历年高考录取分数线，甚至能上清北线！

答案揭晓，这是最新的有道 AI 答疑笔 SpaceOne 交出的答卷，基于大模型的 AI 产品今年能取得这一成绩显然超出了人们的期待。毕竟，仅一年前，GPT-4o、豆包、Kimi 等「大模型考生」在高考卷的测试中集体「偏科」，虽然文科尚可，理科纷纷滑铁卢，最高分甚至都无法进入全体考生的前 30%！业界因此认为，大模型在在综合运用知识和解决复杂实际问题的层面，与人类智力水平仍存在明显差距。而没想到的是，从「名落孙山」到「金榜题名」，人工智能的进步神速。一年间，AI 大模型就从「文科偏科生」进化成清北水平的「全科学霸」，这也让人更看好 AI 大模型的未来。

这次测试中，阅卷老师们在得知是由有道 AI 答疑笔 SpaceOne 给出的答卷后，纷纷给予了很高的评价：推理逻辑缜密，解题步骤完善规范，备考的学生可以将其作为一个 24 小时随身辅助学习的助教，对于有针对性的高效提升是一个有利帮助。

基于教育大模型和推理模型双引擎开发的有道 AI 答疑笔 SpaceOne，具备全科解题不偏科、答题规范不遗漏、知识库庞大且融会贯通的优势，能够针对复杂的难题、大题给出详细、规范的讲解步骤，还支持学生反复追问、个性化提问，完全能够胜任答疑辅导的重任。

而外界更关注的是，不到一个月就是 2025 年全国高考了，届时 AI 大模型考生们还将交出怎样的答卷？在技术发展「一日千里」的语境下，答疑辅导乃至教育教学的诸多任务交给 AI 来完成，是否指日可待？

来源：互联网

最新文章