火山引擎首发「会表演」的有声内容创作平台

摘要

近日,火山引擎正式推出有声内容创作平台。

近日,火山引擎正式推出有声内容创作平台。该平台历经 2 年研发,相较传统平台,其具备多情感演绎和自动化预测两大优势。

据了解,多情感演绎上,有声内容创作平台的「声音超市」不仅提供 70 余款适配不同题材的精品音色,还可通过丰富的情感实现更精彩的演绎;自动化预测层面,平台的 AI 自动区分文本中的对话和旁白、识别对话的情感,整体合理率高达 90% 以上。

目前,火山引擎也针对新用户开展了 5 折限时特惠活动,感兴趣的用户可前往火山引擎官网获取优惠。

70 余款精品音色,情感更丰富的听觉体验

火山引擎的 AI 配音家族已拥有 70 余款精品音色,覆盖各年龄段不同风格的精品音色,可适配各类题材,满足不同企业和用户的有声创作需求。

火山引擎精品「声音超市」

「副语言」也称「类语言」,是指伴随话语出现的某些声音现象,例如停顿、重音、语速、语调等,以及言语的功能性发声,例如笑声、哭腔、咳嗽等。在有声内容创作过程中,仅有音色数量上的积累并不够,为了让 AI 主播像专业配音演员一样演绎出更深层次的「人类情感」,火山引擎为 AI 音色赋予了多样的声音情绪和「副语言」

自动化预测工具,为业务降本增效

在精品 AI 有声内容制作中,需要人工对文本进行标注制作,尤其是长文本中,需要区分人物角色的台词以及对应情感。这一过程耗时耗力,是造成精品 AI 有声内容很难大规模批量生产的原因。

针对这一痛点,火山引擎自研「AI 文本理解」模型,自动预测人物和情感,包括提取文本中对话人物、自动判定情感等能力。

在整体听感与纯人工标注的效果齐平的前提下,AI 文本理解模型可以解放大部分的标注人力,大幅缩减标注的时间和成本,为企业降本增效。

「AI 文本理解」模型

在火山引擎「AI 有声内容创作平台」中,

● 用户只需将目标文本导入,由平台自动完成人物的抽取、并判定对话所属的人物和情感;

● 在配音环节,用户可以自主选择配置 AI 音色来匹配人物,也可选择简单标定角色人设,依据平台内置策略一键配音;

● 配音完成后,平台会根据自动预测的信息完成音频的自动合成和拼接。

AI 有声内容创作平台

未来,火山引擎会持续投入有声内容创作平台的建设与创新,在底层技术和实际应用层面不断探索从「文本」到「有声作品」全流程的一体化智能创作方式,为用户打造更好的使用体验。(作者:张林)

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。