大叔变萝莉,美女变猛男,这个变声喇叭让你刷新三观

摘要

变声器加上大喇叭,这是你从没玩过的黑科技。

「我是渣渣辉……」

「我要代表月亮消灭你……」

走在熙来攘往的大街上,听到这样中二的声音,我脑海中会立即浮现出张家辉、美少女战士们的形象。人可以辨识声音,不同声音让每个人拥有不同特征。相比人脸,声音在公共场合会更加凸显,所以小时候看《名侦探柯南》,不但羡慕柯南有一个厉害的滑板,还希望有一天也能有一个「变声领结」。

现在这个愿望终于得以实现,就在几天前,在日本千叶县举办的 Wonder Festival 大会上展示出一款「变声喇叭」,就能将你开口说出的话立即转换成动漫人物的声音并放大,令人眼前一亮:

大叔变萝莉的神奇道具

这个涂色花哨的喇叭名为 Animegaphone,虽然造型看起来并没有很特别,但正如视频中你看到的那样,它拥有独一无二的「变声」技能,当你开口说话时,喇叭会将声音处理,并转化成动漫人物所说的话。


这项能力的核心在于 AI 技术,通过对事先已经收录的来自声优的声音分析,经过名为「Real Change Voice」的软件转化之后,你的声音就会变成这些声优的声音。


和一般的变声技术只是对声波进行调整不同在于,通过 AI 技术在事先收录他人声音之后,能够将新的声音转变成这些已收录的人物声音,实现真正意义上的变声,因此「大叔变萝莉」也不再只是一句调侃,而是真正可以实现的事。


这款产品项目的发起者,来自日本的 TBWA\HAKUHODO、Yukai Engineering、Crimson Technology 和 KOTOBUKISUN 四家公司,选择将变声器和喇叭结合,一个重要原因在于,对于像地铁站、演唱会等公共场合,即便用喇叭很大声控制秩序,有时仍然效果不佳,因此通过这样一款变声喇叭,可以在一些场合唤起人们注意力,并达到更好的引导效果。

Animegaphone 目前尚处在测试阶段,未正式开卖,并且只包含了两位动漫声优的声音,但它其实可以加入更多有意思的声音类型,做出更有意思的尝试。想象一下,比如在周杰伦演唱会听到喇叭里传来周杰伦「不要挤,排好队」的声音,会不会很让人惊喜?

所以,当你以后身处公共场所,要是再听到萌萌哒软绵绵的萌妹子在声声呼唤,回头一看却是个满脸胡茬的中年大叔时,千万不要感到奇怪,说不定对方手里,正拿着这个神奇的大喇叭呢~

伪造的执念与挑战

人类一直以来都在尝试用技术改造自己,不论是伪造声音,还是伪造动作表情。

利用 AI 技术来让人变换声音其实并不陌生,我们之前也曾和大家介绍过。在 2016 年,Adobe 就展示了名为 Project VoCo 的技术,这项由普林斯顿大学和 Adobe 研究人员共同进行的研究,要解决的问题是如何在没有官方支持旁白的情况下,创造出有声读物。


过去我们要对声音进行编辑,可以对波形手动编辑,但一方面,一个人说话的不同词,字母间的分界很难准确掌握,另一方面在于庞大的编辑量,因此就会出现「鬼畜」的声音片段。但利用 AI 技术,只要能有 20 分钟的声音素材,机器就能尝试理解声音构成,并根据需要生成任何话语。

借助算法,VoCo 可以从语句中搜索并选择出合适音素(单词的部分发音)来组建新词,这一算法能够寻找出一个人说话时的单个因素作为材料,然后通过音轨来转录声波,当用户在这一工具中输入新词时,VoCo 能同时更新音轨,将语音片段自动合成新词。

通过软件合成的声音,在某些场景中几乎可以充当真人语音以假乱真,但仍然会面临包括说话时情绪、语气等挑战,而与此类似,在利用 AI 伪造声音之后,伪造人脸的技术也在不断成熟。


通过 TensorFlow、Keras 等开源软件,之前就已经有网友将成人电影中的人物面部移花接木,变成女明星的脸。这种通过机器学习做出的「假面」爱情动作电影,尽管在一些细节上还是能看出马脚,但却让越来越多的技术宅们充满动力。

不论是伪造声音还是伪造人脸,以目前的技术还不能做到尽善尽美,但当我们给机器足够的素材并进行训练后,距离完美的「造假」似乎只有一步之遥。人类进行创造时会沉迷其中,但当变化越来越快,越来越不受控制时,我们似乎会忘记技术应该造福于人而不是产生更多麻烦。伪造声音也好,伪造人脸也好,如何处理好和社会、道德等多方面关系,也是应该重视的问题。

毕竟,《佛兰肯斯坦》的故事总是在上演。(编辑:Rubberso)

头图来自 Animegaphone 官网


最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。