大模型再战高考题:去年数学全军覆灭,今年竟跨过清北线!

摘要

2024 年,国内外众多 AI 大模型参加全国高考,文科表现优异而理科集体「挂科」的成绩,让外界试出了人工智能的短板。

2024 年,国内外众多 AI 大模型参加全国高考,文科表现优异而理科集体「挂科」的成绩,让外界试出了人工智能的短板。当新一届高考迫在眉睫,人们关注的焦点自然是,一年来不断升级迭代的「AI 考生们」准备好了吗?它们能否一雪前耻?

日前,国内首个教育大模型「子曰」和 DeepSeek-R1 推理模型「双引擎」赋能的有道 AI 答疑笔 SpaceOne 率先出战,与北京海淀区高三学生们一起参加了最新的高考二模同题测试,引起外界普遍关注。

有道发布的视频显示,当有道领世老师们拿到一份特殊的密封答卷时,他们并不知道这位「考生」的来历,一切阅卷流程均按照标准评卷规范进行。最终,这份答卷拿下了语数外 697 分的高分(语文、数学、英语、物理、化学、生物组合),不仅理科全部获得优异成绩,其中生物满分,数学接近满分!

清华大学硕士、英语阅卷老师赵晨曦赞叹道:「即便放眼全国的高考,这都是一份绝对的高分卷!」语文阅卷老师姜博杨则说:「这套题的难度比较大,从作文看得出来知识储备很深厚,是一个标准优等生的议论文。」

清华大学资深物理主讲、物理阅卷老师李楠则判断说:「在北京卷用题新颖的前提下,这个『孩子』的表现还是非常不错的,他可能是搞过物理竞赛吧?」北京师范大学硕士、地理阅卷老师杨翌猜测:「我觉得这应该是在海淀区排名非常靠前的一位『学生』」。

语文 126、数学 145、英语 141、物理 92、地理 93、生物 100、政治 84、历史 87、地理 93……一连串高分,让人看到了这位特殊「考生」超强的全科综合实力。如果选取语文、数学、英语、物理、化学、生物组合,参考北京历年高考录取分数线,甚至能上清北线!

答案揭晓,这是最新的有道 AI 答疑笔 SpaceOne 交出的答卷,基于大模型的 AI 产品今年能取得这一成绩显然超出了人们的期待。毕竟,仅一年前,GPT-4o、豆包、Kimi 等「大模型考生」在高考卷的测试中集体「偏科」,虽然文科尚可,理科纷纷滑铁卢,最高分甚至都无法进入全体考生的前 30%!业界因此认为,大模型在在综合运用知识和解决复杂实际问题的层面,与人类智力水平仍存在明显差距。而没想到的是,从「名落孙山」到 「金榜题名」,人工智能的进步神速。一年间,AI 大模型就从「文科偏科生」进化成清北水平的「全科学霸」,这也让人更看好 AI 大模型的未来。

这次测试中,阅卷老师们在得知是由有道 AI 答疑笔 SpaceOne 给出的答卷后,纷纷给予了很高的评价:推理逻辑缜密,解题步骤完善规范,备考的学生可以将其作为一个 24 小时随身辅助学习的助教,对于有针对性的高效提升是一个有利帮助。

基于教育大模型和推理模型双引擎开发的有道 AI 答疑笔 SpaceOne,具备全科解题不偏科、答题规范不遗漏、知识库庞大且融会贯通的优势,能够针对复杂的难题、大题给出详细、规范的讲解步骤,还支持学生反复追问、个性化提问,完全能够胜任答疑辅导的重任。

而外界更关注的是,不到一个月就是 2025 年全国高考了,届时 AI 大模型考生们还将交出怎样的答卷?在技术发展「一日千里」的语境下,答疑辅导乃至教育教学的诸多任务交给 AI 来完成,是否指日可待?

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。