
近日,火山引擎正式推出有声内容创作平台。
近日,火山引擎正式推出有声内容创作平台。该平台历经 2 年研发,相较传统平台,其具备多情感演绎和自动化预测两大优势。
据了解,多情感演绎上,有声内容创作平台的「声音超市」不仅提供 70 余款适配不同题材的精品音色,还可通过丰富的情感实现更精彩的演绎;自动化预测层面,平台的 AI 自动区分文本中的对话和旁白、识别对话的情感,整体合理率高达 90% 以上。
目前,火山引擎也针对新用户开展了 5 折限时特惠活动,感兴趣的用户可前往火山引擎官网获取优惠。
70 余款精品音色,情感更丰富的听觉体验
火山引擎的 AI 配音家族已拥有 70 余款精品音色,覆盖各年龄段不同风格的精品音色,可适配各类题材,满足不同企业和用户的有声创作需求。

火山引擎精品「声音超市」
「副语言」也称「类语言」,是指伴随话语出现的某些声音现象,例如停顿、重音、语速、语调等,以及言语的功能性发声,例如笑声、哭腔、咳嗽等。在有声内容创作过程中,仅有音色数量上的积累并不够,为了让 AI 主播像专业配音演员一样演绎出更深层次的「人类情感」,火山引擎为 AI 音色赋予了多样的声音情绪和「副语言」。
自动化预测工具,为业务降本增效
在精品 AI 有声内容制作中,需要人工对文本进行标注制作,尤其是长文本中,需要区分人物角色的台词以及对应情感。这一过程耗时耗力,是造成精品 AI 有声内容很难大规模批量生产的原因。
针对这一痛点,火山引擎自研「AI 文本理解」模型,自动预测人物和情感,包括提取文本中对话人物、自动判定情感等能力。
在整体听感与纯人工标注的效果齐平的前提下,AI 文本理解模型可以解放大部分的标注人力,大幅缩减标注的时间和成本,为企业降本增效。

「AI 文本理解」模型
在火山引擎「AI 有声内容创作平台」中,
● 用户只需将目标文本导入,由平台自动完成人物的抽取、并判定对话所属的人物和情感;
● 在配音环节,用户可以自主选择配置 AI 音色来匹配人物,也可选择简单标定角色人设,依据平台内置策略一键配音;
● 配音完成后,平台会根据自动预测的信息完成音频的自动合成和拼接。

AI 有声内容创作平台
未来,火山引擎会持续投入有声内容创作平台的建设与创新,在底层技术和实际应用层面不断探索从「文本」到「有声作品」全流程的一体化智能创作方式,为用户打造更好的使用体验。(作者:张林)
来源:互联网



