度小满金融大模型 C-Eval、CMMLU 双榜排名第一，正式开源！

9 月 22 日, 度小满宣布「轩辕 70B」金融大模型开源, 所有用户均可自由下载和试用, 并公布了「轩辕 70B」在 C-Eval、CMMLU 两大权威大语言模型评测基准的成绩。数据显示, 在 C-Eval 榜单上,XuanYuan-70B 的总成绩达到 71.9 分;在 CMMLU 榜单中, 以 71.05 分的高分位居榜首, 在两大权威榜单上的所有开源模型中排名第一, 也是国内首个同时在两大权威榜单排名第一的金融大模型。

C-Eval 榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集, 几乎囊括了所有国内外的主流模型, 覆盖人文、社科、理工、其他专业四个大方向的 52 个学科, 共有 13948 个多项选择题和中学、本科、研究生、职业等四个难度级别, 是目前对模型潜力判断最具权威性的大模型榜单之一。

CMMLU 数据集是一个综合性的中文评估基准, 由 MBZUAI、上海交通大学、微软亚洲研究院共同推出, 专门用于评估语言模型在中文语境下的知识和推理能力, 共涵盖了 67 个主题, 涉及自然科学、社会科学、工程、人文以及常识等。

金融行业场景丰富, 数字化程度高, 是大模型落地应用的最佳场景之一。但金融又是一个高合规要求的行业, 业务决策复杂, 大模型真正在金融业务中做到实际应用还面临不少挑战。

度小满 CTO 许冬亮表示,「相比通用大模型,『轩辕 70B』金融大模型经过度小满业务场景中沉淀的海量金融数据训练, 对金融知识理解更专业、更精准, 可控性、安全性更高。我们把大模型开源, 希望能够降低大模型在金融行业的部署和应用门槛, 促进金融行业服务效率和服务体验的突破性革新」。

「轩辕 70B」将在社区同时开源金融大模型和 50G 高质量金融语料, 开源下载地址:https://github.com/Duxiaoman-DI/XuanYuan

今年 5 月份, 度小满开源了国内首个千亿参数的金融大模型, 已经有上百家金融机构申请试用。本次发布的新版大模型相较于上一个版本能力全面提升:在增量预训练和指令微调阶段, 加入了度小满业务场景中的海量金融数据, 对金融问题回复更专业, 金融知识理解能力提升明显;同时在预训练阶段,「轩辕 70B」的模型上下文长度扩充到 8k, 能够处理更长的金融报告、研究和分析。

来源：互联网

最新文章