SuperCLUE 公布 2024 值得关注的中文大模型全景图,度小满「轩辕大模型」入选

摘要

中文大模型产业格局呈现蓬勃发展的态势,领军科技企业创新活跃,产业链不断完善,应用场景日益丰富,正成为驱动数字经济发展、赋能行业转型升级的重要引擎。

中文大模型产业格局呈现蓬勃发展的态势,领军科技企业创新活跃,产业链不断完善,应用场景日益丰富,正成为驱动数字经济发展、赋能行业转型升级的重要引擎。近日,SuperCLUE 公布了 2024 值得关注的中文大模型全景图,覆盖了金融、医疗、汽车、教育等多个垂类领域中值得关注的中文大模型,度小满「轩辕大模型」成功入选,同时入选的还有百度「文心一言」、腾讯「混元大模型」、阿里「通义千问」等中文大模型。

「轩辕大模型」是度小满在 2023 年 5 月开源的国内首个千亿级金融大模型。「轩辕」用度小满实际业务场景积累的海量金融数据训练而来,通过独创的 hybrid-tuning 的创新训练方式,实现在大大增强金融能力的同时,不损失通用能力。自开源以来,已经有上百家金融机构申请试用「轩辕」大模型。2023 年 9 月,度小满开源「轩辕-70B」金融大模型,「轩辕-70B」在 C-Eval 和 CMMLU 两大权威榜单上位列所有开源模型榜首。2023 年 12 月 22 日,度小满「轩辕」大模型通过《生成式人工智能服务管理暂行办法》备案。

目前,大模型技术已经应用在度小满各个业务场景,从营销、客服、风控、办公再到研发,已经初见成效。在代码助手方面,用大模型辅助生成的代码,采纳率能够达到 42%,帮助公司整体研发效率提升了 20%;在客服领域,大模型推动服务效率提升了 25%。在智能办公领域,大模型目前的意图识别准确率已达到 97%。

SuperCLUE 是国内权威通用大模型综合性测评基准,其前身可追溯至第三方中文语言理解评估基准 CLUE(The Chinese Language Understanding Evaluation)。自 2019 年成立以来,CLUE 基准一直致力于提供科学、客观、中立的语言模型评测,其先后推出了 CLUE、FewCLUE、KgCLUE、DataCLUE 等多个被广泛认可的评估标准。根据 CLUE 多年测评经验,SuperCLUE 基于通用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准。

来源:互联网

 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。