伯俊 CTO 洞察:AI 模特换装背后的隐忧和挑战有哪些?

摘要

今年伊始,ChatGPT 的东风不仅吹向了国内科技圈,也吹向了包括零售电商在内的许多细分领域。

今年伊始,ChatGPT 的东风不仅吹向了国内科技圈,也吹向了包括零售电商在内的许多细分领域。

ChatGPT 是 AI 行业发展的一个里程碑,正在引发一场生产力变革。它在市场营销等方面已多有应用:设计师用它快速生成图像和视频,文案人员用它帮助自己写文章、写文案、写脚本……甚至已经有不少领域在用 ChatGPT「搞钱」了。

我们也从各种新闻报道中可以看到,曾经数万元成本才能拿下的假发模特实拍,如今依靠 ChatGPT 和 Midjourney,仅用 10 分钟就能生成好几版,而且实测模拟显示,AI 绘图会比实拍更加真人化,渲染完成之后绝对要比人工拍的好。

AI 模特换装真的有这么好吗?现在遇到的问题有哪些?

AI 模特换装带来的隐忧

正所谓「外行看热闹、内行看门道」。作为 CTO,我认为把一项新技术注入产品,去赋能业务的时候,要考虑很多因素。当前这个阶段,大模型进步非常快,但还是有很多问题没有解决。

另外,用户场景的需求本身也不完全一样,应用程序的运行环境也不一样。比如知识更新需要重新训练大模型,费时费力,所以它的时效性有缺陷,无法做到对最新消息的知晓,对信息时效性要求高的场景并不适合。大模型是千亿级参数的,需要设备端和云端实时连接,所以对于网络通讯能力较弱、低功耗的设备不太适用。

因此,大模型虽然在很多地方适用,但也有一些场景不适用,作为企业,要去考虑如何调整,如何去抓住机会。

区别于以往的人工智能产品,ChatGPT 不单单是文本生产的工具,其强大的语言处理和生存能力也增加了很多的用户体验,同时也为我们降低了生产经营、交易的成本,同时也提高了企业的经营效率,而这种大规模的适配器以及迭代的能力也是 ChatGPT 的特点,它在特定的领域、专业语言以及自动化的客户服务等各方面都做出了巨大的成就。

我个人认为 ChatGPT 在零售行业,未来有非常广阔的发展空间。

随着数字化、智能化时代的到来,消费者对于购物体验和个性化需求的要求越来越高。尤其在服装电商领域,消费者更加注重对服装的直观了解和购买体验。因此,对于电商商家来说,如何降低营销成本、提高营销质量,成为亟待解决的问题。

以模特换装为例,目前市场上服务的商家均表示,通过 AI 模特换装,能够为电商商家提供更好的营销解决方案,可以降低商家的营销成本,还可以提高商家的竞争力和展示效果,让消费者更直观地了解服装。

我们了解到目前 AI 模特换装从技术和实际情况都带来一些问题和隐忧。

我了解到,一位电商从业者在 AI 技术上投入了约 200 多万,打算从此不再雇用真人模特;一位淘宝服装店主正在培训技术人员,等夏季上新时就换上 AI 模特;一位模特经纪公司老板正在学习 AI 绘画工具,打算不再聘用签约模特。

种种做法,让很多人觉得真人模特会失业。事实上,这种担忧目前还是多虑,以现在的技术而言,AI 模特换装还不能做到完全自动化。

目前 AI 生成的人物图已经较为成熟,海量的人物照片已经被喂进 AI 的大模型中,在此基础上,可以通过自定义训练集对模型进行微调,比如脸、衣服的部分。据了解,目前做 AI 模特的同行,大多是直接使用已训练好的模型。

一般来说,只要输入相应的文本关键字,AI 就能生成相应图片。如果商家想要一位棕色长发的女性模特形象,那么输入「棕色」「长头发」「女性」的关键词,AI 就会生成不同样貌的棕色长发女性。在此基础上,如果商家偏好其中某一个,可以固定参数,在之后的换衣步骤中使用同一位 AI 模特。

不过 AI 图看多了之后,还是能分辨出不是真人,比如 AI 的脸都长得差不多、身材也类似,有些腰细得不太合理。目前,许多训练好的 AI 模特模型都使用了来自日本、韩国的数据,长相带有明显的日韩风。这也是为什么很多用 AI 做模型的小公司,训练了数个自定义模型,再混到原先的模型里,生成的脸还是带有原来模型的感觉。

其实,很难去校准一个完全脱离 AI 味的东西。这个局限性当然可以解决,比如你再去训练,但是每一次训练,成本又上去了。

再比如,即便使用 AI 生成的图片可以多达每秒 30 余张,甚至更多,但是从真人视角去看,可以使用的可能一张都没有。

对于使用 AI 模特的商家而言,换装试衣的技术非常关键。目前商家的做法主要有两种方式可以实现:一种是拍摄衣服各个角度的照片,借助 LoRA 模式训练这些照片,生成模特穿上这条裙子后的各个姿势图像;另一种方式是重绘,需要把衣服套在石膏假人上并拍照,将衣服部分固定下来,再生成 AI 模特和仿真背景。

不过这样还是存在很多问题。前者生成的图像不能保证百分之百地还原衣服,可能有 10% 的细节会丢失。比如,原本衣服上的一朵小花,生成后可能会变成一个圆点,这种情况下,需要再进行细调或人工后期。而后者,每次将衣服套上模型并拍照,也会增加时间成本。从你拍下来的照片,到直接一张成品的图,没有那么自动。

机遇和挑战

实际上,AI 模特仍有局限,目前 AI 模特的繁琐之处在于生成之后仍需人工筛图,比如 AI 生成 10 张图,其中可能有几张质量不高,或细节画错,这时候就需要人工筛选出更好的图,再进行后续操作。

据我观察,AI 模特的技术已经具备,但能否大规模商用,取决于成本和效率。假如说成本还不够,或者成本不合算,即使有技术也没用,但是大家都看到这个前景了。

围绕着 ChatGPT 和 AI,国内已经有不少厂商早已开始投入研发和进行相关业务场景的布局,这也是当下最火热的赛道。

以科大讯飞为例,前不久,科大讯飞星火认知大模型正式上线,这也意味着科大讯飞正式加入类 ChatGPT 模型的竞争。

众所周知,科大讯飞可以说是智能语音领域的王者。虽然已经有多家平台推出了类 ChatGPT 模型,但是主打「AI+行业」模式的科大讯飞可以更好的将人工智能运用在各个行业之中。这在目前国内的人工智能市场中,是独特的存在。

科大讯飞的星火 AI 可以很好的将企业结合在一起,围绕着知识问答、代码编程、数理推算、创意联想、言翻译等多个使用场景,通过海量的文本代码和知识学习,通过自然对话的方式,理解用户需求,并有效执行任务。

这一切的背后都是服务用户和消费者。

事实上,早在 2021 年,科大讯飞便与我们伯俊科技进行了合作,共同探索私域经营。

作为伯俊的战略客户,科大讯飞和伯俊科技再次联手,伯俊科技将通过构建商品统一服务能力、一方数据沉淀能力、全渠道联合库存能力、全渠道订单服务能力、全渠道信息敏捷响应能力、数智化分析评估能力,助力科大讯飞实现数字化转型。

在星火 AI 加持下, 伯俊科技将为科大讯飞提供可靠支持,为其消费者业务的数字化转型打下坚实基础,共同推动零售行业技术进步和业务协同发展。

(作者系伯俊 CTO 陈雨陆)

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。