业内首发泛娱乐底座大模型！元象开源 XVERSE-Ent 中英双模型，单卡部署超低门槛

12 月 31 日，元象正式开源聚焦泛娱乐场景的底座大模型 XVERSE-Ent，包含中、英文双版本。模型深度适配泛娱乐（Entertainment）核心领域，覆盖社交互动、游戏叙事、文化创作（含小说、剧本）等关键场景，支持轻量化部署与垂直场景深度落地，填补了泛娱乐领域专属开源大模型的空白。

XVERSE-Ent 在通用大模型能力基础上，依托元象 AI 泛娱乐产品服务全球千万级用户的实践经验，经稀缺的垂直领域数据深度训练与优化，在角色一致性、剧情逻辑等方面能更精准地契合泛娱乐场景的真实需求，为中小开发者与泛娱乐企业提供了低成本、高效率的泛娱乐创新底座模型。模型特色主要体现为：

角色一致性强化：能长期保持虚拟角色人设、记忆与说话风格稳定，有效优化「遗忘」或「出戏」的问题。

长剧情精准理解：精准把握复杂故事线、人物关系与伏笔，生成逻辑合理的剧情。

多元语境适配：针对不同题材（古风、科幻、都市等）具备丰富的风格化表达与背景知识。

中英双开源，核心技术创新

依托两大核心技术创新，XVERSE-Ent 实现「通用能力稳、领域适配准、部署成本低」的核心优势，分别开源中英双版本模型，精准满足多语言泛娱乐创作与全球化出海需求，形成「技术筑基+多语言拓展」的完整泛娱乐开源方案。技术创新如下：

1、MoE 热启动技术：基于一个 Dense 模型改造出一个 MoE 模型。第一步，将 Dense 模型的 FFN 部分进行细粒度拆分，得到多个子网络，每个子网络作为 MoE 模型的一个专家；结合推理时的显存大小，对专家子网络进行一定次数的复制。第二步，复用 Dense 模型的 attention 部分。

FFN 部分的细粒度拆分方式如下图所示。图中，完整的 FFN 被拆分为 2 个子网络。

相对的，完整 FFN 不做拆分作为一个专家的方式，称为粗粒度，如下图所示。在实践中，细粒度拆分方式的效果更好，也能更灵活地根据硬件配置进行模型结构的设计。

2、多阶段训练策略：通过 S0 能力重建、S1 语言倾斜、S2 领域增强三个阶段的训练，构建适用于特定语言、特定领域的专用模型。前 2 个阶段的数据为通用数据，后 1 个阶段的数据为通用数据和领域数据的混合。

整体流程示意如下：

本次开源包含两大文本模态模型，满足多语言应用落地需求：

中文：XVERSE-Ent-A4.2B，总参数量 25B，由通用底座 XVERSE-MoE-A4.2B 经过 S2 领域增强获得，针对中文语境下的角色扮演、故事生成、对话互动进行了极致优化，文化契合度高。

英文：XVERSE-Ent-A5.7B，总参数量 36B，依托成熟的出海应用经验打造，在英文创意写作、游戏对话及跨文化交流场景中表现优异。

中英文模型的上下文窗口大小均为 8K，经过了近万亿 token 数据的训练。

模型现已在 Github、Huggingface 与魔搭开源。

性能卓越，低成本部署

评测结果显示，XVERSE-Ent 泛娱乐模型不仅在小说与对话生成等泛娱乐核心任务上表现卓越，更在 MMLU、数学、代码等通用能力上基本不下降，能力保留 98% 以上。这标志着模型成功实现了「专精」与「通用」的平衡：既成为特定领域的专家，又保持了应对多样任务的全能选手潜力，从根本上规避了能力单一化的风险。

XVERSE-Ent 中英文模型评测结果

（*X 开头的为领域能力相关的指标，数值越低越好；fiction：小说类文本构成的测试；conversation：对话类文本构成的测试集；webcc：通用文本构成的测试集）

模型支持高并发低成本部署方案，支持云端单卡部署，实现推理成本与处理效率的平衡，大幅降低开发者的部署门槛与运维成本。

落地成效显著，赋能产品全球化布局

泛娱乐产业作为数字经济的重要增长体，市场空间巨大，模型应用量极高。根据前不久 OpenRouter 与 a16z 联合发布的基于全球 300 多个模型的百万亿级 token 数据分析报告显示，角色扮演已成为开源模型最主要的落地场景，占据超过 50% 的开源模型使用量，尤其在游戏化互动、创意叙事等泛娱乐场景中备受青睐。

角色扮演在 2025 年开源模型应用中占比最高

源自：《State of AI：An Empirical 100 Trillion Token Study with OpenRouter》

元象将聚焦泛娱乐的模型 XVERSE-Ent 开源，正精准契合这一市场需求，以开源模型赋能千行百业，旨在与全球开发者共建繁荣、共享进步的泛娱乐 AI 生态。

目前，XVERSE-Ent 已成功落地 AI 社交产品「Saylo」。依托模型在泛娱乐场景的深度技术赋能，Saylo 在全球几十个国家和地区登上免费榜单和畅销榜单前列，在美国、德国、法国、意大利、拉美地区均收获海量用户和稳健商业回报。模型在剧情连贯性、角色人设统一性、多轮交互趣味性等核心指标上表现突出，验证了技术创新与商业落地的高效融合。

元象始终坚信开源是加速技术创新与产业普及的最有效路径。作为长期深耕开源生态的践行者，元象已相继成功开源国内最大参数 Dense 模型 XVERSE-65B（2023 年）、国内最大参数 MoE 模型 XVERSE-MoE-A36B（2024 年）、世界最长上下文模型 XVERSE-Long（2024 年）等重量级通用底座大模型，及 XVERSE-V 多模态模型，能够进行多样化的场景适配，构建起覆盖通用能力、轻量化部署等多维度的开源模型全家桶。

此次 XVERSE-Ent 泛娱乐大模型的发布与开源，将进一步完善元象开源生态布局，为中小开发者与泛娱乐企业降低创新门槛，未来元象还将探索多模态生成能力，持续拓展泛娱乐 AI 的应用边界，让开源成果惠及更多场景与用户。

来源：互联网

最新文章