
近年来,新兴技术发展日新月异,新应用也层出不穷,随着 AI 绘画的爆火,AIGC 为创作领域带来了前所未有的改变。
近年来,新兴技术发展日新月异,新应用也层出不穷,随着 AI 绘画的爆火,AIGC 为创作领域带来了前所未有的改变。
近期,昆仑万维正式发布了 AIGC 全系列算法与模型——昆仑天工,其模型包括天工巧绘 SkyPaint、天工乐府 SkyMusic、天工妙笔 SkyText、天工智码 SkyCode,涵盖领域包括图像、音乐、文本和编程四个领域,是国内目前为止模型最丰富的 AIGC 工具。
文本生成图片是 AIGC 领域需求量最大的服务,天工巧绘 SkyPaint 采用全球第一款多语言 Stable Diffusion 分支模型,兼容 Stable Diffusion,在出图效果、精确度和速度上在同类产品中处于领先地位,其在增加中文提示词输入能力的同时兼容原版 stable diffusion 的英文提示词模型,之前用户积累的英文提示词手册依然可以在模型上使用。
天工巧绘 SkyPaint 作品
在中英文匹配方面,天工巧绘 SkyPaint 使用 1.5 亿级别的平行语料优化提示词模型实现中英文对照,不仅涉及翻译任务语料,还包括了用户使用频率高的提示词中英语料,古诗词中英语料字慕语料,百科语料,图片文字描述语料等多场景多任务的海量语料集合,这类中文适应模型能力对于国内用户来说是迫切需求。
在模型训练方面,天工巧绘在训练时采用模型蒸馏方案和双语对齐方案,使用教师模型对学生模型蒸馏的同时辅以解码器语言对齐任务辅助模型训练,使得出图效果可以更加精确。
图 2 昆仑天工 AI 绘画作品
昆仑天工的文本模型天工妙笔 SkyText 拥有多样的下游能力,包括续写,对话,中英翻译,内容风格生成,推理,诗词对联等,并在各项专业性领域的任务中(例如分类、匹配、填空、识别)表现突出,在实际测评结果上与现有大模型相比具有多方面优势。昆仑天工系列产品针对中文领域构建了千亿级别的高质量数据案,包含数百张 A100 GPU 显卡的超算集群,训练得到百亿参数量的 GPT-3 生成模型。
昆仑天工的编程模型天工智码 SkyCode 支持多种主流代码语言(java,javascript,c,c++,python,go,shell)的续写,根据代码注释写代码 (解题),支持根据中文注释来序列代码,这个功能也是最受程序员关注的,Sky-code 可以直接集成到编辑器中,无缝衔接在开发环境,在键入代码的同时,智能高效补全代码,提升工作效率,节省开发时间。
AI 音乐方面,天工乐府 SkyMusic 是国内第一款商用级作曲 AI 模型,该模型引入全局信息约束、和弦隐式表征,和弦准确率达到 92.5%,远超目前行业最佳 64.7%;支持中文、英文、日文、韩文、法文等 31 种语种,支持从旋律生成歌词、文案素材生成歌词,且支持全球多曲风。
可以预见的是,AIGC 技术的发展会极大程度上改变创作领域的格局,它降低了创作的门槛,让普通人可以做出原本专业人士才可以创作的作品,这是生产工具的变革,也是生产力的解放,一个新的时代即将到来。
基于昆仑万维在文娱、社交、游戏等不同行业的深度商业沉淀和领先的互联网运营能力,昆仑天工在 AI 作曲、AI 绘画、AI 编程、AI 文本四大领域的输出能力,将与昆仑万维的元宇宙业务形成协同效应,让昆仑万维有望站上元宇宙风口。
来源:互联网