第三届美图影像节,美图奇想大模型(MiracleVision)V5 交出「AI 工作流」答卷

摘要

6 月 12 日,在第三届美图影像节上,美图公司宣布美图奇想大模型(MiracleVision)已升级到 V5,将通过「AI 工作流」进一步助力电商、广告、游戏、影视、动漫五大行业。并以该模型能力为基石,推出 AI 短片创作工具 MOKI,助力用户实现多种视频场景的 AI 短片创作。

6 月 12 日,在第三届美图影像节上,美图公司宣布美图奇想大模型(MiracleVision)已升级到 V5,将通过「AI 工作流」进一步助力电商、广告、游戏、影视、动漫五大行业。并以该模型能力为基石,推出 AI 短片创作工具 MOKI,助力用户实现多种视频场景的 AI 短片创作。

V5 涵盖图像、视频、音频、文本大模型

作为美图 AI 产品生态的基石,美图奇想大模型(MiracleVision)发布于 2023 年 6 月第二届美图影像节,它也是国内首个懂美学的 AI 视觉大模型,为美图全系产品提供 AI 模型能力。

经过将近一年迭代,第三届美图影像节现场,美图公司创始人、董事长兼首席执行官吴欣鸿宣布美图奇想大模型(MiracleVision)已升级到 V5 版本,采用美图自研 DiT 技术架构,涵盖图像大模型、视频大模型、音频大模型和文本大模型,拥有更好的扩展性与更大的参数量,在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面,获得全方位提升。

美图奇想大模型(MiracleVision)的升级也进一步完善了美图的 AI 产品生态:应用层有 AI 图像、AI 视频、AI 设计、AI 营销四大模块的多款产品,生态层由中国领先的视觉创意平台站酷和美图 AI 助手 RoboNeo 提供服务,模型层由美图奇想大模型(MiracleVision)为全系产品提供 AI 模型能力。

AI 视频产品如何落地?奇想大模型助力 MOKI 给出答案

今年 2 月,OpenAI 发布文生视频模型 Sora,并引发文生视频领域的激烈竞赛。

在 Sora 发布后,美图第一时间升级了视频大模型技术架构。从 U-net 架构升级到了更强的 DiT 架构。影像节现场公布的信息显示,升级后的美图视频大模型拥有 6 大亮点:更强的模型架构和更大的参数量,结合更精准的语义理解,实现了更长的视频时长,动态连续性和画面稳定性也大幅提升。

「作为一家以美为核心的公司,我们对效果有着极高的要求。只有自研视频大模型,才能以高标准不断提升效果。同时,只有将模型与产品深度融合,做到模型即产品,才能给用户最好的体验。」吴欣鸿表示。原本需要实拍的视频,通过 AI 就可以生成,这个趋势正越来越近。

美图还通过 AI 短片创作工具 MOKI 解决了视频大模型「故事成片难」、「可控性较差」的问题。与常规文生视频产品不同,MOKI 深度理解视频创作者需求,实现内容和成本的双重可控,目前可以进行多种视频场景的 AI 短片创作。

吴欣鸿表示,MOKI 让视频创作前所未有的简单高效,无论你是个人还是专业团队,只要你有想法,都能轻松地将它变成短片作品。

来源:互联网

 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。