
摘要
今年文心大模型动作不断,昨日正式开源了文心大模型 4.5 系列。
近期大火的罗永浩数字人受到行业热议,其神形音容与真人无异,直播首秀创 1300 万人次观看、GMV5500 万元的行业纪录。这背后的技术支持,与百度文心大模型密不可分。今年文心大模型动作不断,昨日正式开源了文心大模型 4.5 系列。但此次开源其实并不突然,早在今年 2 月,百度就已预告了文心大模型 4.5 系列的推出计划,并明确将于 6 月 30 日起正式开源。
据介绍,此次文心大模型 4.5 开源系列,涵盖 47B、3B 激活参数的混合专家(MoE)模型,与 0.3B 参数的稠密型模型等 10 款模型,预训练权重和推理代码完全开源。开发者可在飞桨星河社区、HuggingFace 等平台下载部署使用,也可在百度智能云千帆大模型平台使用开源模型 API 服务。
评测显示,文心大模型 4.5 开源系列在多个文本和多模态基准评测中实现 SOTA。文心大模型 4.5 开源系列在视觉常识、多模态推理、视觉感知等多个多模态大模型评测中优于闭源的 OpenAI o1;轻量级模型也能以小搏大,文心 4.5-VL-28B-A3B 多模态模型是目前同量级最好的多模态开源模型,甚至与更大参数模型 Qwen2.5-VL-32B 不相上下。
AI 数字人在今年成为爆发式增长的 AI 应用,离不开多模态大模型的快速发展。以百度为例,上半年连发 4 款文心大模型,包括首个多模态基础大模型文心 4.5 和效果更好、成本更低的多模态大模型文心 4.5T。基于多模态大模型,百度发布了高说服力数字人,其形神音超拟真、内容更专业,效果媲美真人。IDC 报告显示,目前百度居中国 AI 数字人市场份额第一。
百度多个 AI 应用产品基于今年持续迭代的文心大模型大幅提升功能与使用量。近期,百度智能代码助手文心快码发布独立 IDE,为行业首个多模态交互、多智能体协同 AI IDE;文小言升级多模型调度、图片问答等能力;百度文库、网盘今年已连续推出具备全模态内容输入输出的内容领域操作系统、AI 相机等应用产品。最新财报显示,百度文库 AI MAU 已达 9700 万,为国内月活用户规模最大的 AI 应用产品之一;一季度,智能体为客户创造的收入同比增长 30 倍。
而伴随着文心大模型开源,百度 AI 应用规模化落地和大模型生态构建无疑将获得更大助推。近期李彦宏表示,开源有助于扩大新技术的采用率,他强调无论开源、闭源,基础模型只有解决现实问题,才具备真实价值。他今年提出的多个预判「数字人将成 2025 突破性应用」、「2025 会是智能体爆发元年」也将因开源加速变成现实。