美图公司吴欣鸿:正紧锣密鼓进行视频模型的更新和迭代

摘要

「视频垂直场景与AI原生工作流的结合应用机会巨大」

年初,Sora 的亮相引发了视频生成领域的风潮。无论是作为通向 AGI 的里程碑事件,还是 Sora 带给影视动画行业的想象空间,都让文生视频迅速成为 AI 领域的焦点。

3 月 28 日,第十一届中国网络视听大会在成都举行,美图公司创始人、董事长兼首席执行官吴欣鸿发表主题演讲《视频大模型如何助力网络视听创作》。

会上,吴欣鸿透露,目前美图公司正紧锣密鼓进行视频模型的更新和迭代,准备在视频生成领域大展拳脚。此前,他曾表示美图将聚焦在图像和视频领域,挖掘垂直场景,打造产品力非常强的AI原生应用。

大会现场,吴欣鸿展示了一支主题为「动物疯狂赛车」的 60 秒视频。

这支视频基于美图视觉大模型 MiracleVision(奇想智能) 的图像生成、视频生成能力。具体来说,它使用了开拍的「AI 脚本」、「AI 数字人」功能,WHEE 的「文生图」、「AI 生视频」功能,Wink 的「视频编辑」功能,仅用半天就完成了故事脚本、分镜设计、视频生成、唇形同步、视频编辑等视频制作流程。

「以 Sora 为代表的视频大模型只是开始。」在吴欣鸿看来,目前只是视频大模型的 2.0 阶段,以 Sora 为代表的视频大模型正在尝试理解世界,具有一定涌现能力,能够生成 30-60 秒的视频

吴欣鸿认为,在视频大模型 3.0 阶段,可以实现更丰富的物理运动,视频大模型也将具备剧情设计、分镜、转场等能力,值得用户和行业期待。

谈及视频垂直场景,吴欣鸿认为,视频垂直场景与 AI 原生工作流的结合,在 AI 视频生成、AI 视频编辑、AI 视频渲染等领域有巨大应用机会。美图正在上述领域进行创新探索,新产品将在今年 6 月的美图影像节上亮相。

自 2014 年起,美图公司通过美图秀秀、Wink、开拍等一系列影像工具,持续助力网络视听内容创作。目前,Wink 已进入中国视频编辑赛道前三名,开拍已成为口播博主的新宠。

截至 2023 年 12 月,我国网络视听用户规模达 10.74 亿。2023 年网络视听市场规模首次突破万亿元。

针对网络视听的内容生产和产业发展,吴欣鸿表示,美图公司将全力推进自研大模型的视频能力,为网络视听行业提供更优质的视频创作工具。

 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。