魔搭社区与浦数平台达成深度合作,引入超 7000开源数据集

摘要

以开源数据集加速中国AI大模型研发

6 月 20 日消息,魔搭社区与浦数人工智能开放数据平台 OpenDataLab 达成深度合作,魔搭社区开发者将可直接调用浦数平台上超 7000 个开源数据集,以高质量数据加速 AI 大模型研发。

数据和模型的融合是推动 AI 技术发展的核心动力。整合各类关键资源,构建一个高效、协同的开发环境,成为加速中国 AI 应用创新的关键。基于这一理念,聚焦开源数据的浦数平台与聚焦开源模型的魔搭社区达成深度合作,实现底层接口打通,共同推动模型与数据的无缝对接,为中国开发者打造从数据获取、模型下载、模型调优到部署应用的一站式开发体验,降低 AI 创新门槛。

浦数平台 OpenDataLab 是上海人工智能实验室在 WAIC 2022 大会上发布的人工智能开源开放体系的核心项目之一,致力于为国产大模型提供高质量的开放数据资源。目前,浦数平台已汇聚 7700 多个大模型相关的优质、开源数据集,覆盖计算机视觉、自然语言处理、多模态、通用机器学习、音频识别等领域 800 多种任务类型。

魔搭社区是阿里云 2022 年牵头成立的 AI 模型开源社区,在业界首个提出了 MaaS 模型即服务的理念。经过一年多的发展,魔搭已成为国内规模最大、最活跃的开源模型社区,也是中国众多顶尖大模型开源的首发平台,此前已汇聚 4500 多款优质模型及上千开源数据集,为超过 500 万开发者提供模型及免费算力服务。

本次合作后,浦数平台和魔搭社区在数据存储、数据展现、工具链等技术层面,实现了互联互通。用户可以在魔搭社区上直接下载和管理从浦数平台迁移过来的数据集,或在魔搭训练推理框架中直接调用相关数据对模型进行微调。新引入的海量开源数据集,将极大丰富魔搭平台上的数据资源,让开发者选模型、找数据一站搞定。

 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。