多模态再突破!文心新模型登上 LMArena 视觉理解榜国内第一

摘要

1 月 8 日,全球权威大模型评测平台 LMArena 公布最新排名。

1 月 8 日,全球权威大模型评测平台 LMArena 公布最新排名,文心大模型 ERNIE-5.0-Preview-1220 以 1226 分的成绩,登上 LMArena 视觉理解榜(Vision Arena)中国第一,全球第八,是该榜单中唯一进入全球前十的中国大模型,实现国产模型在多模态视觉理解方向的阶段性突破。

在同榜模型对比中,ERNIE-5.0-Preview-1220 的综合表现超过 Gemini-2.5-Flash、GPT-5-Chat、Qwen3-VL-235B-A22B-Instruct 等多款国内外主流多模态模型,进入全球多模态模型第一梯队。

值得一提的是,在 LMArena 视觉理解榜的创意写作中,ERNIE-5.0-Preview-1220 位列全球第二,仅次于 Gemini-3-Pro,显示出在视觉理解与跨模态创作能力上的领先水平。

公开资料显示,文心大模型于 2019 年首次对外发布,文心大模型 5.0 是百度今年 11 月发布的原生全模态大模型。该模型参数量达 2.4 万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

此前,文心大模型 5.0 Preview 在 LMArena 文本榜中位列中国第一,在创意写作、高难度指令等方面表现突出,超过 Claude-Opus-4-1、GPT-5.2 和 Qwen3-Max-Preview 等多款国内外主流模型。

业内专家表示,文心大模型在多项国际主流评测中的稳定表现,显示国产大模型正逐步融入全球顶级模型竞争体系,中国 AI 技术的国际竞争力持续增强。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。