第三届美图影像节，美图奇想大模型（MiracleVision）V5 交出「AI 工作流」答卷

6 月 12 日，在第三届美图影像节上，美图公司宣布美图奇想大模型（MiracleVision）已升级到 V5，将通过「AI 工作流」进一步助力电商、广告、游戏、影视、动漫五大行业。并以该模型能力为基石，推出 AI 短片创作工具 MOKI，助力用户实现多种视频场景的 AI 短片创作。

V5 涵盖图像、视频、音频、文本大模型

作为美图 AI 产品生态的基石，美图奇想大模型（MiracleVision）发布于 2023 年 6 月第二届美图影像节，它也是国内首个懂美学的 AI 视觉大模型，为美图全系产品提供 AI 模型能力。

经过将近一年迭代，第三届美图影像节现场，美图公司创始人、董事长兼首席执行官吴欣鸿宣布美图奇想大模型（MiracleVision）已升级到 V5 版本，采用美图自研 DiT 技术架构，涵盖图像大模型、视频大模型、音频大模型和文本大模型，拥有更好的扩展性与更大的参数量，在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面，获得全方位提升。

美图奇想大模型（MiracleVision）的升级也进一步完善了美图的 AI 产品生态：应用层有 AI 图像、AI 视频、AI 设计、AI 营销四大模块的多款产品，生态层由中国领先的视觉创意平台站酷和美图 AI 助手 RoboNeo 提供服务，模型层由美图奇想大模型（MiracleVision）为全系产品提供 AI 模型能力。

AI 视频产品如何落地？奇想大模型助力 MOKI 给出答案

今年 2 月，OpenAI 发布文生视频模型 Sora，并引发文生视频领域的激烈竞赛。

在 Sora 发布后，美图第一时间升级了视频大模型技术架构。从 U-net 架构升级到了更强的 DiT 架构。影像节现场公布的信息显示，升级后的美图视频大模型拥有 6 大亮点：更强的模型架构和更大的参数量，结合更精准的语义理解，实现了更长的视频时长，动态连续性和画面稳定性也大幅提升。

「作为一家以美为核心的公司，我们对效果有着极高的要求。只有自研视频大模型，才能以高标准不断提升效果。同时，只有将模型与产品深度融合，做到模型即产品，才能给用户最好的体验。」吴欣鸿表示。原本需要实拍的视频，通过 AI 就可以生成，这个趋势正越来越近。

美图还通过 AI 短片创作工具 MOKI 解决了视频大模型「故事成片难」、「可控性较差」的问题。与常规文生视频产品不同，MOKI 深度理解视频创作者需求，实现内容和成本的双重可控，目前可以进行多种视频场景的 AI 短片创作。

吴欣鸿表示，MOKI 让视频创作前所未有的简单高效，无论你是个人还是专业团队，只要你有想法，都能轻松地将它变成短片作品。

来源：互联网

最新文章