多模态再突破！文心新模型登上 LMArena 视觉理解榜国内第一

1 月 8 日，全球权威大模型评测平台 LMArena 公布最新排名，文心大模型 ERNIE-5.0-Preview-1220 以 1226 分的成绩，登上 LMArena 视觉理解榜（Vision Arena）中国第一，全球第八，是该榜单中唯一进入全球前十的中国大模型，实现国产模型在多模态视觉理解方向的阶段性突破。

在同榜模型对比中，ERNIE-5.0-Preview-1220 的综合表现超过 Gemini-2.5-Flash、GPT-5-Chat、Qwen3-VL-235B-A22B-Instruct 等多款国内外主流多模态模型，进入全球多模态模型第一梯队。

值得一提的是，在 LMArena 视觉理解榜的创意写作中，ERNIE-5.0-Preview-1220 位列全球第二，仅次于 Gemini-3-Pro，显示出在视觉理解与跨模态创作能力上的领先水平。

公开资料显示，文心大模型于 2019 年首次对外发布，文心大模型 5.0 是百度今年 11 月发布的原生全模态大模型。该模型参数量达 2.4 万亿，采用原生全模态统一建模技术，具备全模态理解与生成能力，支持文本、图像、音频、视频等多种信息的输入与输出。

此前，文心大模型 5.0 Preview 在 LMArena 文本榜中位列中国第一，在创意写作、高难度指令等方面表现突出，超过 Claude-Opus-4-1、GPT-5.2 和 Qwen3-Max-Preview 等多款国内外主流模型。

业内专家表示，文心大模型在多项国际主流评测中的稳定表现，显示国产大模型正逐步融入全球顶级模型竞争体系，中国 AI 技术的国际竞争力持续增强。

最新文章