SuperCLUE 公布 2024 值得关注的中文大模型全景图，度小满「轩辕大模型」入选

中文大模型产业格局呈现蓬勃发展的态势，领军科技企业创新活跃，产业链不断完善，应用场景日益丰富，正成为驱动数字经济发展、赋能行业转型升级的重要引擎。近日，SuperCLUE 公布了 2024 值得关注的中文大模型全景图，覆盖了金融、医疗、汽车、教育等多个垂类领域中值得关注的中文大模型，度小满「轩辕大模型」成功入选，同时入选的还有百度「文心一言」、腾讯「混元大模型」、阿里「通义千问」等中文大模型。

「轩辕大模型」是度小满在 2023 年 5 月开源的国内首个千亿级金融大模型。「轩辕」用度小满实际业务场景积累的海量金融数据训练而来，通过独创的 hybrid-tuning 的创新训练方式，实现在大大增强金融能力的同时，不损失通用能力。自开源以来，已经有上百家金融机构申请试用「轩辕」大模型。2023 年 9 月，度小满开源「轩辕-70B」金融大模型，「轩辕-70B」在 C-Eval 和 CMMLU 两大权威榜单上位列所有开源模型榜首。2023 年 12 月 22 日，度小满「轩辕」大模型通过《生成式人工智能服务管理暂行办法》备案。

目前，大模型技术已经应用在度小满各个业务场景，从营销、客服、风控、办公再到研发，已经初见成效。在代码助手方面，用大模型辅助生成的代码，采纳率能够达到 42%，帮助公司整体研发效率提升了 20%；在客服领域，大模型推动服务效率提升了 25%。在智能办公领域，大模型目前的意图识别准确率已达到 97%。

SuperCLUE 是国内权威通用大模型综合性测评基准，其前身可追溯至第三方中文语言理解评估基准 CLUE(The Chinese Language Understanding Evaluation)。自 2019 年成立以来，CLUE 基准一直致力于提供科学、客观、中立的语言模型评测，其先后推出了 CLUE、FewCLUE、KgCLUE、DataCLUE 等多个被广泛认可的评估标准。根据 CLUE 多年测评经验，SuperCLUE 基于通用大模型在学术、产业与用户侧的广泛应用，构建了多层次、多维度的综合性测评基准。

来源：互联网

最新文章