行业首次!百度蒸汽机发布通用 AI 长视频生成功能

摘要

9 月 25 日,全球首个中文音视频一体化视频生成模型百度蒸汽机再次升级,发布通用 AI 长视频生成功能。

9 月 25 日,全球首个中文音视频一体化视频生成模型百度蒸汽机再次升级,发布通用 AI 长视频生成功能。该功能支持用户生成无限长度的 AI 视频,并带来「流式无限生成」的全新体验。

本次升级在行业尚属首次,突破了此前 AI 仅能生成 5 秒、10 秒短视频,或依赖首尾帧控制续写时长的局限,采用流式生成技术实现了在通用长视频上的「无限」生成能力。此外,蒸汽机还首创「可交互需求」,支持生成过程中随时提交 prompt。这意味着,用户在生成过程中可随时暂停,并基于已生成的画面提交新的 Prompt(提示词)来引导后续剧情发展。这相当于为 AI 视频创作配备了「无限画布」,能随时捕捉并落地迸发的灵感,实现更灵活、连续的创作流程。

据悉,百度蒸汽机视频生成模型主打「多人对话音视频一体化生成」。用户仅需输入一张参考图和一段文本描述,即可直接生成具备电影级质感、包含多人对话与精准口型同步的视频内容。据透露,百度蒸汽机还将于 10 月中旬进一步升级,支持实时交互的长视频生成功能,包括可交互数字人、VR/AR 视频内容以及动态游戏世界的生成能力。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。