
近日,快手自研大模型产品「可图」(Kolors)正式对外开放
近日,快手自研大模型产品「可图」(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线 20 余种 AI 图像玩法。目前,用户可以通过「可图大模型」官方网站和微信小程序,免费使用各项 AI 图像功能。
(「可图大模型」微信小程序)
从具体功能上看,一方面,可图提供 AI 形象定制功能,即图生图功能,通过人像保持技术,可轻松保留人像的自然特征,并一键生成各种风格的人像作品,满足不同社交及营销场景的个性化形象需求。例如,用户只需上传一张面部轮廓清晰的照片,并选择偏好的风格,调节保留面部特征的程度,便可创作出既有个性又富含艺术感的头像。
目前,可图已上线 10 余种 AI 形象定制风格玩法。在六一儿童节来临之际,可图还特别推出了 QQ 秀风格的「红钻贵族」和「我的小时候」两种玩法,支持用户上传图片生成复古像素风格化图片和童年写真,打造个人二次元 IP 形象,回味美好的童年时光。
(可图「红钻贵族」风格玩法)
(可图「我的小时候」风格玩法)
此外,可图还提供粘土世界、炫彩琉璃、梦幻莫奈、甜蜜情人节、春日卡通、水彩浪漫等风格化玩法,以及韩式写真、魔法学院、帅气赛车、浪漫海岛等写实风玩法,打造专属的个性化写真。
(可图写实人像玩法)
另一方面,快手可图大模型也提供 AI 创作功能,即文生图,支持用户自由输入文本,生成风格多样、画质精美、创意十足的绘画作品。同时用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。
例如,根据「油画,被鲜花簇拥的猫咪,布偶,浮雕质地,多层次维度,栩栩如生,粉色氛围感」等文字描述,可图生成了质感十足、细节生动的猫咪油画。不仅动物画极具创意,在人物画方面,可图同样功能强大,基于「男孩,天真可爱,水汪汪的大眼睛,背面,转头微笑,高清,亚麻色卷发,小斗篷」等描述生成的超写实作品,细节刻画精美,人物形神兼备。
不仅是油画,国画、动漫等多样风格的绘画作品,可图均可一一呈现。在可图输入文本「荷塘,水墨画,留白,意境,齐白石风格,细腻的笔触,宣纸的纹理」,一幅荷塘图即刻生成。根据「戴草帽的男人,肩上站着一只鹦鹉,极简,波西米亚风格」等描述,可图同样生成了高质量的精美 AI 图片。
值得注意的是,「可图」大大降低了 AI 图像生成的使用门槛,提供了更好的使用体验:与同类产品需多张照片和较长时间来完成 AI 生成不同不同,可图只需一张图片和几秒钟时间,便可生成一套效果优秀的 AI 图像。
在强大的功能背后,快手大模型团队的技术能力为产品提供了有力支撑。例如,在中文特色理解方面,可图基于快手自研的知识图谱构建了上亿级别的中文特色图文数据,结合中文大语言模型的文本表征能力,能够精准描绘和表达各类中文场景。
据悉「可图」大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研 AI 技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。
同时,在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,同时引入了经过优质专家标注的图文数据集,以对齐人类审美偏好,提升模型性能表现。
据媒体报道,去年 9 月,「可图」大模型平台已在快手开启内测,快手在 App 评论区推出的「AI 玩评」和「AI 小快」等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。
近日,在 2024 年一季度财报电话会上,快手 CEO 程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。随着大模型产品可图的正式发布,快手也将持续为用户带来更丰富有趣的 AI 互动新体验。