十秒钟生成一只宝可梦,《幻兽帕鲁》AI 抄袭实锤了?

摘要

现在你也可以随手生成一排宝可梦导入游戏里。

作者 | Li Yuan 

编辑 | 郑玄

 

2024 年开年,幻兽帕鲁抄袭的 drama 从游戏圈一路争议到了 AI 圈。 小团队,无经验,快速开发出精美的游戏,游戏资产和宝可梦相似又不相同,几个关键词的叠加,迅速引爆了人们的想象。

幻兽帕鲁游戏社长溝部拓郎(Takuro Mizobe)将一个充满了毕业生和爱好者的团队,能够快速研发出一款高复杂度的游戏称为「巧合」,而大家却不买账——这个巧合的名字该不会是 AI 吧?

AI 圈的人也没闲着。昨天,我就看到了两条相关的演示视频——使用宝可梦的图片,十秒钟就能生成一个像模像样的宝可梦的 3D 模型,可以直接导出进入游戏使用。

这,AI 抄袭实锤了?带着这样的好奇,我去和两条视频的创作团队分别聊了聊,AI 生成 3D 资产,现在已经做到了什么程度。

 

十秒生成宝可梦风的怪物

 

两条视频中的一条视频,来自 VAST 公司。2023 年成立的 VAST 公司,在去年年底上线了通用 3D 模型 Tripo,目前在 tripo3d.ai 的网页上和 Discord 上都能体验相关的 3D 生成服务。

类似于图片生成的 Midjourney 服务,用户只需要输入关键词或者上传一张 2D 图片,Tripo 就能在 5-10 秒内直接生成 4 个比较初步的 3D 模型,而用户满意的话,则可以选择进一步生成精度更高的 3D 模型。

图片来自VAST AI 演示

在视频里,用户输入了「voxel rock monster」(体塑风岩石怪物,体塑风的风格有点类似于乐高积木。)的提示词,在五分钟之内,平台就生成了一个粗版的绿色岩石怪物的 3D 模型。

而再通过平台即将上线的一些插件对贴图的呈现风格进行微调后,生成的绿色岩石怪物,能够变得更像 Minecraft 游戏中的风格,可以直接被导入 Minecraft 游戏中进行使用。

除了文生 3D 之外,Tripo 也能进行图生 3D。视频结尾,一排宝可梦风格的两脚兽,四脚兽,飞禽,在 Minecraft 世界里组成了一个微观小花园一样的建筑群,显得诡异又壮观。

图片来自VAST AI 演示

 

而另一条视频,则来自影眸科技公司。

影眸科技从 2016 年开始进行人脸采集生成 3D 模型的业务,积累了许多人脸方面的 3D 数据,在人脸生成 3D 模型技术方面有格外心得。据 CTO 张启煊介绍,其人脸生成 3D 的服务,应该是目前国内 3D 生成里面唯一一个走进游戏生产端的产品。

而在通用 3D 模型生成方面,目前,影眸也开放了通过聊天生成 3D 模型的服务 ChatAvatar。此次视频中,展示的则是即将上线的 Rodin Gen-1 模型的能力。

影眸科技Demo

视频中主要展示了图生 3D 的能力。演示者直接拖拽了一个宝可梦的图片到平台中,通过简单的点选生成了提示词——比如「生成人物」「光滑」「对称」,在十秒钟之内就生成了一个白模(只有模型而没有材质和纹理等)。

影眸科技特意强调了生成的模型十分光滑,而且能做出更加尖锐的结构。「可以看到第一只宝可梦的尾巴上的刺结构很清晰,这是在之前的 3D 生成中几乎做不到的。」视频中讲到。

影眸科技表示,十秒钟生成的模型仍然较为初步,正式的版本里能够生成比视频中清晰度高 4 倍的模型。

 

技术突破来自近3个月 幻兽帕鲁还用不上

 

AI 生成 3D 模型都已经发展到这个水平了?用宝可梦的图片,几秒钟就能生成一只宝可梦的 3D 模型?那幻兽帕鲁的抄袭实锤了?

带着这样的疑问,我采访了 VAST 公司的 CTO 梁鼎和影眸科技的 CTO 张启煊。出乎我意料的是,两人的答案相当一致,幻兽帕鲁大概率不是用 AI 做出的 3D 模型。

在幻兽帕鲁的 AI 抄袭门中,一个重要的「实锤」来自 X 平台上一位用户 byo 对于对幻兽帕鲁的 3D 模型与宝可梦的 3D 模型,进行的对比。

幻兽帕鲁的3D模型与宝可梦的3D模型的对比

可以看到,幻兽帕鲁的 3D 模型虽然与宝可梦的模型不完全相同,但在对一个自然不存在的神奇动物的设计上,其相似性还是很难解释。

暴雪前游戏设计师 Eric Covington 直接表示,「意外地」创建比例如此接近的复杂模型网络实际上是不可能的。」

假如幻兽帕鲁的确进行了一些灰色操作,模型的相似可能来自于直接抄袭——解包宝可梦游戏,对于其中的 3D 模型进行小范围的拼接变形和重构,那可不可能是训练材料源于宝可梦模型的人工智能生成的呢?

毕竟,幻兽帕鲁的社长,很早就对使用人工智能来避开版权问题,表现出了极大的兴趣。早在 2022 年,他就曾在推特上表示:「经过人工智能的过滤,一个图像将变成新的图,那么版权问题也许会得到解决?我惊讶地发现世界实际上正在朝这个方向发展。在大约 30 年内,公众对于版权的看法,可能会发生很大变化。」

更加让人产生怀疑的,是 2021 年 12 月,幻兽帕鲁的社长转发 BuzzFeed 工程师使用一种名为 ruDALL-E 的方法全自动生成的宝可梦,表示 AI 生成的宝可梦已经让他分不清哪个是真的宝可梦了。

幻兽帕鲁的社长推特发言

 

2022 年,团队甚至还开发了一款名为《AI:艺术仿冒者》的游戏——是的,就叫这个名字。游戏机制其实是一个 AI 绘画版本的谁是卧底。玩家拿到词语之后,自己添加一个新词让 AI 画出一副相关的画作,最后玩家根据 AI 画出的画作,猜出谁是卧底。这起码证明团队到 2022 年,在 AI 生成图像方面,有一定的技术积累。

不过,在观察了幻兽帕鲁游戏的最终表现后,两位处于 3D 模型生成业界应用的领域前沿的专家,最终还是向我表示,AI 的 3D 模型生成技术,目前还不足以支撑这样的应用。

「可以看到,最终的游戏中,模型表面非常光滑对称,而且每个模型都具有复杂的动作。而市面上已经上市的产品里,都不具有这样的能力。」VAST 公司的 CTO 梁鼎表示,「目前能够提供给大众的产品中,基本上能够生成的都是静态的模型,不具备可驱动的能力。而让模型的手、脚等等能够动起来,其实工作量非常大。尤其是不同种类的幻兽,有的有翅膀没有的没翅膀,有的两只脚有的四只脚,没有办法做统一的比较好的处理,在 AI 上也没有一个很好的解决方案。」

幻兽帕鲁宣传页 图片来源:Steam

 

影眸科技的 CTO 张启煊也提到了光滑性的问题:「目前市面上的很多产品,因为采取的技术路线的问题,生成的 3D 模型,把贴图去掉之后,模型其实是一团浆糊,没有办法做出很尖锐的结构。」

除此之外,他还提到了性价比的问题。「AI 做 3D 模型,始终是完成前 60-70% 的内容。而对于帕鲁这样的游戏来说,其实大量的工作来自于最后对帕鲁的细节调优,比如某只脚的位置设计上。在 AI 生成的 3D 模型上进行修改,要比从数据库里、从资产库里找一个比较好的模型来改更复杂。后者只需要找一个入门的模型师就可以。」

如果只是对宝可梦的模型进行了人工的更改的话,似乎也更能解释游戏的模型和动作开发速度,为什么远高于行业的平均速度。

X 用户名为 @Cecilia Fae 的 3D 动画工程师,深度参与了幻兽帕鲁「打假」,发了视频解释了幻兽帕鲁的 3D 模型和宝可梦相似的可能原因。

简要而言,将 3D 模型的动作进行复制粘贴是很简单的,但是如果两个模型之间的外貌,比例都不一样,复制粘贴的效果会很差。但两者的比例越接近,这样的粘贴就越简单,只需按一下按钮就可以复制和粘贴动画。

也就是说,如果幻兽帕鲁的团队只是使用人工的方式对宝可梦的模型进行了简单修改,会大大加速其研发时间。采取人工智能的方式,反而不见得性价比很高。

「一定要做的话,一些比较先进的团队或许能够做出来,但是需要整个团队为它服务。而这个技术突破,也是近三个月才能比较接近实现的。」梁鼎表示,「幻兽帕鲁游戏很明显不是近三个月做出来的。」

 

人工智能或将很快将进入游戏研发中

 

虽然幻兽帕鲁大概率并没有使用 AI 对 3D 模型生成进行「降本增效」,不过两家 3D 模型生成的公司的技术展示,已经让我看到:3D 模型生成领域在飞速进展,不久的将来,类似的技术一定会被应用到游戏中。

而幻兽帕鲁的母公司,对于应用 AI 技术到产品中来制造爆款游戏,也毫不避讳。

其新作《Never Grave: The Witch and The Curse》上周刚刚发布预告。预告中直接表明,作为一款 Roguelite 的游戏,在这款新作中,玩家将能够在随机生成的地下城关卡,与敌人进行战斗。很明显,随机生成的关卡中,一定使用了不少 AI 技术。

新作仍然背上了抄袭缝合的指控,此次指向的则是空洞骑士。空洞骑士的续作《空洞骑士:丝绸之歌》已跳票多年,因此不少网友戏称「谁先出谁是丝绸之歌。」

虽然此次幻兽帕鲁的 AI 抄袭门大概率是一个乌龙,AI 技术(或许加上一些缝合操作)加速游戏开发节奏,改变游戏世界,已经是可以看到的趋势。

帕鲁公司新作

我向两位技术专家询问了目前 AI 3D 模型生成在游戏界的使用情况。

影眸科技的 CTO 张启煊表示:「现在比较靠谱的使用方式是用这项技术来做原画,来验证;想要的概念,进行相关的策划。」除此之外,在人脸垂类上,影眸科技的技术已经进入了生产管线。

而 VAST 公司的 CTO 梁鼎提到,一些游戏公司会考虑在一些不是很显眼的地方,使用 AI 生成的 3D 模型。「比如一个房间里角落里的沙发,散落的吉他等等。」

除此之外,也有一些先锋游戏,专门利用 AI 能很快生成 3D 资产的特性设计游戏:Tripo Go 就是这样一个小游戏,核心玩法就是一个角色不断吸收新的物品,每吸收一个物品就能变身成新的样子。不考虑角色必须精致平滑,关键点在于有趣和快速生成。

对于未来的大规模使用,张启煊提出了一个想法:「2D 的图片生成目前已经很成熟,但 3D 生成因为数据量不够丰富,自由度小很多。如果能够通过 2D 生成生成丰富类型的图片,再用 3D 生成转化成 3D 模型的话,感觉可以做出一些新的玩法。」

梁鼎还提到了目前 3D 模型生成还需要突破的几个方向:「一方面是几何上更加光滑、对称、平整,一方面是让模型能够动起来。另外 PBR 的效果,目前也是 3D 模型生成需要做的更好的地方。」最后一点指的是,如果生成一个类似于手机这样的真实物品,如何让塑料的手机壳玻璃的手机屏幕同时在一个自然环境下反光,还显得很真实,对于目前的 3D 模型生成是一个难点。不过如果制作一个幻兽帕鲁一样的游戏,则这样的问题并不关键。

最后留下的一个问题是:未来用 AI 生成的 3D 模型做游戏,会面临版权问题吗?

对此,我咨询了隆安湾区 AI 法律研究中心主任陈焕律师。

他表示,游戏中一些属于「公有领域」的要素表达,不太涉及版权问题。比如可达鸭,原型是鸭嘴兽,那么鸭嘴兽的一般特征就属于「公有领域」的表达。

对于游戏角色是否侵权的判断,则要看作品是否与在先作品构成实质性相似,判断方法包括「抽象分离法」和「感觉测试法」。

AI 生成的宝可梦,很明显还是会与原来的宝可梦观感相似。但 AI 生成的宝可梦,可能不会和原来的模型产生重合,或者能够直接被溯源到原模型。在这样的情况下判断实质性相似,目前还没有相关判例,可能需要看未来法院在个案上的一些判断。

 

 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表具有科技的商业洞见。