业内首发泛娱乐底座大模型!元象开源 XVERSE-Ent 中英双模型,单卡部署超低门槛

摘要

12 月 31 日,元象正式开源聚焦泛娱乐场景的底座大模型 XVERSE-Ent,包含中、英文双版本。

12 月 31 日,元象正式开源聚焦泛娱乐场景的底座大模型 XVERSE-Ent,包含中、英文双版本。模型深度适配泛娱乐(Entertainment)核心领域,覆盖社交互动、游戏叙事、文化创作(含小说、剧本)等关键场景,支持轻量化部署与垂直场景深度落地,填补了泛娱乐领域专属开源大模型的空白。

XVERSE-Ent 在通用大模型能力基础上,依托元象 AI 泛娱乐产品服务全球千万级用户的实践经验,经稀缺的垂直领域数据深度训练与优化,在角色一致性、剧情逻辑等方面能更精准地契合泛娱乐场景的真实需求,为中小开发者与泛娱乐企业提供了低成本、高效率的泛娱乐创新底座模型。模型特色主要体现为:

角色一致性强化:能长期保持虚拟角色人设、记忆与说话风格稳定,有效优化「遗忘」或「出戏」的问题。

长剧情精准理解:精准把握复杂故事线、人物关系与伏笔,生成逻辑合理的剧情。

多元语境适配:针对不同题材(古风、科幻、都市等)具备丰富的风格化表达与背景知识。

中英双开源,核心技术创新

依托两大核心技术创新,XVERSE-Ent 实现 「通用能力稳、领域适配准、部署成本低」的核心优势,分别开源中英双版本模型,精准满足多语言泛娱乐创作与全球化出海需求,形成「技术筑基+多语言拓展」的完整泛娱乐开源方案。技术创新如下:

1、MoE 热启动技术:基于一个 Dense 模型改造出一个 MoE 模型。第一步,将 Dense 模型的 FFN 部分进行细粒度拆分,得到多个子网络,每个子网络作为 MoE 模型的一个专家;结合推理时的显存大小,对专家子网络进行一定次数的复制。第二步,复用 Dense 模型的 attention 部分。

FFN 部分的细粒度拆分方式如下图所示。图中,完整的 FFN 被拆分为 2 个子网络。

相对的,完整 FFN 不做拆分作为一个专家的方式,称为粗粒度,如下图所示。在实践中,细粒度拆分方式的效果更好,也能更灵活地根据硬件配置进行模型结构的设计。

2、多阶段训练策略:通过 S0 能力重建、S1 语言倾斜、S2 领域增强三个阶段的训练,构建适用于特定语言、特定领域的专用模型。前 2 个阶段的数据为通用数据,后 1 个阶段的数据为通用数据和领域数据的混合。

整体流程示意如下:

本次开源包含两大文本模态模型,满足多语言应用落地需求:

中文:XVERSE-Ent-A4.2B,总参数量 25B,由通用底座 XVERSE-MoE-A4.2B 经过 S2 领域增强获得,针对中文语境下的角色扮演、故事生成、对话互动进行了极致优化,文化契合度高。

英文:XVERSE-Ent-A5.7B,总参数量 36B,依托成熟的出海应用经验打造,在英文创意写作、游戏对话及跨文化交流场景中表现优异。

中英文模型的上下文窗口大小均为 8K,经过了近万亿 token 数据的训练。

模型现已在 Github、Huggingface 与魔搭开源。

性能卓越,低成本部署

评测结果显示,XVERSE-Ent 泛娱乐模型不仅在小说与对话生成等泛娱乐核心任务上表现卓越,更在 MMLU、数学、代码等通用能力上基本不下降,能力保留 98% 以上。这标志着模型成功实现了「专精」与「通用」的平衡:既成为特定领域的专家,又保持了应对多样任务的全能选手潜力,从根本上规避了能力单一化的风险。

XVERSE-Ent 中英文模型评测结果

(*X 开头的为领域能力相关的指标,数值越低越好;fiction:小说类文本构成的测试;conversation:对话类文本构成的测试集;webcc:通用文本构成的测试集)

模型支持高并发低成本部署方案,支持云端单卡部署,实现推理成本与处理效率的平衡,大幅降低开发者的部署门槛与运维成本。

落地成效显著,赋能产品全球化布局

泛娱乐产业作为数字经济的重要增长体,市场空间巨大,模型应用量极高。根据前不久 OpenRouter 与 a16z 联合发布的基于全球 300 多个模型的百万亿级 token 数据分析报告显示,角色扮演已成为开源模型最主要的落地场景,占据超过 50% 的开源模型使用量,尤其在游戏化互动、创意叙事等泛娱乐场景中备受青睐。

角色扮演在 2025 年开源模型应用中占比最高

源自:《State of AI:An Empirical 100 Trillion Token Study with OpenRouter》

元象将聚焦泛娱乐的模型 XVERSE-Ent 开源,正精准契合这一市场需求,以开源模型赋能千行百业,旨在与全球开发者共建繁荣、共享进步的泛娱乐 AI 生态。

目前,XVERSE-Ent 已成功落地 AI 社交产品「Saylo」。依托模型在泛娱乐场景的深度技术赋能,Saylo 在全球几十个国家和地区登上免费榜单和畅销榜单前列,在美国、德国、法国、意大利、拉美地区均收获海量用户和稳健商业回报。模型在剧情连贯性、角色人设统一性、多轮交互趣味性等核心指标上表现突出,验证了技术创新与商业落地的高效融合。

元象始终坚信开源是加速技术创新与产业普及的最有效路径。作为长期深耕开源生态的践行者,元象已相继成功开源国内最大参数 Dense 模型 XVERSE-65B(2023 年)、国内最大参数 MoE 模型 XVERSE-MoE-A36B(2024 年)、世界最长上下文模型 XVERSE-Long(2024 年)等重量级通用底座大模型,及 XVERSE-V 多模态模型,能够进行多样化的场景适配,构建起覆盖通用能力、轻量化部署等多维度的开源模型全家桶。

此次 XVERSE-Ent 泛娱乐大模型的发布与开源,将进一步完善元象开源生态布局,为中小开发者与泛娱乐企业降低创新门槛,未来元象还将探索多模态生成能力,持续拓展泛娱乐 AI 的应用边界,让开源成果惠及更多场景与用户。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。