打造电商视觉新引擎:Vidu Q1 参考生图实现商品&场景&营销素材 AI 一站式生成

摘要

AI 生图领域,终于迎来中国力量的高光时刻。

AI 生图领域,终于迎来中国力量的高光时刻。

在 Google 发布 Nano Banana 仅 10 天后,生数科技旗下视频大模型 Vidu 于 9 月 9 日正式推出 Vidu Q1 参考生图功能,以支持 7 张参考图输入打破国内生成上限,并在一致性、还原度等关键指标上全面超越 Flux.1 Kontext,正面对标 Nano Banana。

这意味着,一直由国际巨头主导的 AI 生图赛道,首次出现了具备差异化竞争力、甚至局部实现超越的中国创业公司。Vidu Q1 参考生图的发布,不仅是一次技术迭代,更是一场围绕 AI 生图领域的国产逆袭。

此次 Vidu 发布的 Q1 参考生图主要有五大亮点:

Vidu Q1 参考生图以「参考够多,还原够真」为核心,主要包括五大亮点:

1、参考数量行业领先

同时支持 7 张参考图输入,可控性强。

2、主体一致性更强

在多人、多场景、多次生成下,依旧保证人物/主体的面貌与特征不跑偏。

3、高还原度,真实感更强

在保持参考图特征的同时,还原度高,更贴近用户原始输入,真正做到「所见即所得」。

4、创作自由度极高

一张图 + 一句提示词,就能自由换装、换背景、自由合成。支持多人同场景或者多人多场景,满足复杂剧情、合影、多角色电商等场景。

5、支持 1080P 高清分辨率,中文语义理解更强

一、对标谷歌 Nano Banana,国产 AI 生图迎来突破

通过多组案例对比可清晰看出,Vidu Q1 参考生图在生成一致性方面显著优于 Flux.1 Kontext,并在部分场景中媲美甚至超越 Nano Banana:

在人物拿着电饭煲的案例中,Nano Banana frequently 出现物体悬空、摆放不合理的问题,生成的饭碗并未放置到合理位置,而 Vidu 生成结果自然合理,符合物理规律;

在上图的例子中,Nano Banana 并没有理解提示词中补全彩虹的意思,彩虹只出现了另外半边,而 Vidu Q1 参考生图则做到了将没有出现在图片中的另外半边彩虹补全,形成了完整挂在天上的双彩虹景象,表现出了极高的画面理解能力和一致性。

从第三方评测机构来看,Vidu 在 AI 参考生图的一致性指标上超过了谷歌的 Nano Banana 和 Kontext,位居第一。

在一致性、真实性、清晰度、美学、语义理解等综合指标评分中位居第二,仅次于谷歌 Nano Banana。

值得一提的是,在能力全面对标 Nano Banana 的同时,Vidu Q1 参考生图对国内用户也更为友好,无需翻墙,操作更为简单,对于中文理解更强。相对于 Nano Banna 无法指定输出图片比例,Vidu 可支持多种比例图片输出,同时 Vidu Q1 参考生图支持 1080P 高清像素,更适合商用场景。

二、三大模式全覆盖:合成、替换、变换解锁行业创新应用

除了过硬的一致性,Vidu Q1 参考生图还支持「合成+替换+变换」三大模式,可覆盖电商、广告、动漫、影视、设计等多行业场景。

万物皆可合成

Vidu Q1 参考生图支持让不同人物同框或者将某个人物或者商品放入具体场景中,让想象中的画面成真,让不可能成为可能。

1、复杂场景合成

通过指定某主体在某个场景中做什么,可以生成高大上的杂志封面、商品海报、动漫短剧分镜。

中秋节来临,Vidu Q1 参考生图也能成为电商、设计师们的提效神器。

2、人物、商品同框场景

利用 Vidu Q1 参考生图功能,即可和你喜欢的明星同框。

比如输入你和明星的照片和大头贴框,即可生成你和泰勒斯威夫特在海边的合影照,融合自然,仿佛是在某个海边拍的偶遇照片。

3、服装流行元素合成

Vidu Q1 参考生图在服装设计领域也有广泛的应用场景。

用 Vidu Q1 参考生图把裙子换上今年夏天最时髦的碎花花纹,变身最潮达人。

万物皆可替

Vidu Q1 参考图中的人物、道具、场景都可以随意替换,不仅可玩性高,而且也大幅提高创意资产复用率,不到半小时即可批量产出实用产品宣传素材、海报大片。

1、场景替换

十一假期来临,利用 Vidu Q1 参考生图,帮助用户解锁热门旅游地,再也不用」人从众」中各种找角度拍照,也无需等待黄金拍照时间,即可快速生成完美旅游打卡照。

2、道具替换

同样的背景,通过道具替换,可产出一系列产品素材图,适用于 TO C 玩法以及产品上新场景。

3、主体替换

还可以通过主体替换的方式实现影视剧、海报的角色替换。

4、AI 虚拟换装

《穿 Prada 的女魔头 2》正在紧锣密鼓拍摄中,曾经《穿 Prada 的女魔头》中的女主角安妮. 海瑟薇在一天的拍摄中就需要换 4 套服装,换装速度之频繁令人印象深刻。而现在利用 Vidu Q1 参考生图,服装模特不到 5 分钟就可实现迅速换装,对于消费者来说,也可以通过 AI 换装直观感受试穿效果。

万物皆可变

Vidu Q1 参考生图不仅仅能实现替换、合成,而且还可实现线稿转 3D、照片转手办、转冰箱贴、线稿上色、老照片修复等酷炫功能。

1、线稿转 3D

Vidu Q1 参考生图能将复杂的建筑设计图,直接转化为 3D 立体模型图,建筑细节精准还原,省去复杂的建模流程。

2、线稿上色

通过指定建筑物替换成木头材质,并为周围的景观涂色,生成一张上色后的建筑效果图。

3、变成冰箱贴

Vidu Q1 参考生还可以一张普通的平面照片直接变成立体冰箱贴,真实得如商场售卖的纪念品。

4、变身手办

当然最近很火的手办玩法,Vidu Q1 参考生图也能稳定发挥,不仅支持二次元转手办,还可以让真人直接变成桌面手办,与真人简直神同步。

5、特效画面

Vidu 还支持用户解锁特效玩法,让动漫人物自带特效。

三、从追赶到超越,AI 创业公司的进阶之路

作为 Vidu 首款参考生图产品,Vidu Q1 一经推出便实现对谷歌 Nano Banana 的全面对标,在 AI 生图这一巨头云集的赛道中展现出中国创业公司的硬核技术实力。

Vidu Q1 参考生图的发布,是中国 AI 多模态领域的一次重要突破。它证明了中国团队不仅能够紧跟国际发展,更能在关键技术上实现差异化创新甚至局部超越。在 AI 生图走向「生产级」应用的关键节点,Vidu 终于为中国公司争得了一席之地。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。