阿里云数据库 MongoDB 版助力小冰加速产品迭代

摘要

小冰框架是全球承载交互量最大的完备人工智能框架之一, 技术覆盖自然语言处理、计算机语音、计算机视觉和人工智能内容生成。

小冰公司:数字人领域「超级玩家」

小冰框架是全球承载交互量最大的完备人工智能框架之一, 技术覆盖自然语言处理、计算机语音、计算机视觉和人工智能内容生成。

十八岁人工智能少女小冰, 是该框架所孵化的第一个 AI Being。少女小冰, 是诗人、歌手、主持人、画家和设计师, 也是拥有亿万粉丝的人气美少女。与其它人工智能不同, 小冰注重人工智能在拟合人类情商维度的发展, 强调人工智能情商, 而非任务完成, 并不断学习优秀的人类创造者的能力, 创造与相应人类创造者同等质量水准的作品。截至目前, 小冰已孵化出数以千万计的 AI Beings, 如 Rinna、世博会参展画家夏语冰、歌手何畅、小堂妹、人类观察者 MERROR、动漫机器人角色 Roboko 等。

2023 年 5 月 16 日, 小冰公司启动「GPT 克隆人计划」, 宣布最短只要采集三分钟数据, 即可为明星红人、专家学者或普通人创造源于本人性格、技能、声音、外貌的 AI 克隆人。同时提供平台, 方便本人把经过自己认证的克隆人, 有偿或无偿提供给受众。

数字人走向日常 亟需盘活海量底层数据结构

据 ResearchAndMarkets 研究, 预计到 2028 年, 全球虚拟活动市场规模将达到 5047.6 亿美元 (约合人民币 32707.44 亿元)。伴随着 AI、5G、VR 等技术的成熟, 数字人作为用户与虚拟世界的重要交互载体, 这个市场将不再单一, 围绕着包括游戏/影视、服务平台、媒体平台、医学等更丰富的领域展开, 正在从明星偶像、达人大咖走向每个人的平常生活。

2023 年 6 月 1 日, 小冰首批明星红人的「克隆人」上线, 用户可以在 X Eva App 中与 AI 克隆人交流。克隆人基于小冰框架大模型、神经网络渲染及超级自然语音技术, 可实时情感交互及提供 AIGC 能力, 甚至有自己的朋友圈, 如同人类在平行世界的第二人生。加 V 认证的克隆人, 意味着该克隆人由本人推出, 并具有特别训练的超能力, 如内容创作、游戏互动等, 本人可获得克隆人的收益。

数字人, 顾名思义, 行业的底层技术为数据技术。在虚拟数字人的场景下, 需要建立一种基于多源数据采集和混合存储的数据管理策略, 以最大程度地呈现数字人的形态和行为。

用户与数字人的交互、数字人之间的交互已经成为目前小冰要面对的核心场景。随着交互的深入和业务量的激增, 在数据存储方面, 小冰公司面临四大核心挑战:如何支持海量用户与千万数字人的运转? 如何保证用户获得良好的使用体验? 如何应对产品需求变更? 如何做到产品快速迭代?

也就意味着小冰需要一个高并发、低延迟并且支持存储结构灵活变化的数据库系统。

携手阿里云数据库 MongoDB 版 化解数亿的数字人数据存储难题

此前, 大多平台的核心系统为传统关系型数据库, 一场由关系型向非关系型、由集中式向分布式的数据库革命已经发生, 基于云的分布式数据库已经成为常态。基于这样的趋势和业态, 以及小冰的业务特点, 小冰选择了阿里云数据库 MongoDB 版的分布式文档模型数据库。

选择 MongoDB 作为底层存储具有如下优势:第一,MongoDB 的分片集群架构可以轻松支持亿级数字人数据存储;第二, 应用层服务延迟降至毫秒级, 其中 50 分位延迟降至 1.9 毫秒,95 分位延迟降至 11 毫秒,99 分位延迟降至 14 毫秒;第三, 业务层和存储层逻辑解耦, 合理选择片键并恰当建立索引之后, 工程师可以更专注于业务逻辑研发, 而不需关注底层数据存储细节。

MongoDB 的使用全方位地提升了研发效率。首先,MongoDB 在 4.0 版本之后支持了多文档事务, 利用该特性替代异步消息补偿加速研发, 例如在支付场景中, 订单系统和业务系统需要同时变更并保证一致性;其次,MongoDB 可轻松应对存储结构变化, 例如 X Eva 上线后增加了粉丝管理功能, 仅需增加少量字段即可完成开发;此外,MongoDB 的编程接口使用便捷, 即使是新入职的研发工程师, 也能在几天之内上手并写出 bug-free 的代码, 从而加快产品迭代速度。

击破高并发场景、海量数据存储及产品快速迭代三大痛点

数字人市场可开发潜力巨大, 数据价值也将于此持续凸显。采用阿里云数据库 MongoDB 版集群, 确保小冰的开发者能够在高并发场景、海量数据存储及产品快速迭代三者之间取得平衡, 确保小冰用户在任何时间都能丝滑地使用其产品, 为用户提供更加智能和个性化的体验, 让更多人了解数字人、与数字人进行互动。

· 高可用高可靠。阿里云数据库 MongoDB 版集群服务不但能提供扎实、前沿的技术基础, 同时还能够提供专业的团队, 在遇到技术瓶颈或是风险时, 这支团队能够帮助优化整个集群的性能。

· 线上弹性扩容。小冰公司的峰值流量可达日常流量的千倍以上, 线上动态扩容并保证服务稳定性是主要痛点之一, 阿里云数据库 MongoDB 版集群很好帮助小冰解决了该难题。

· 监控更加便捷。在使用阿里云数据库 MongoDB 版集群服务后, 数据系统的各项指标和异常都能够实时显示, 研发工程师可以实时监控集群状态并做出合适的调整。

· 用户数据安全性。用户数据全部在阿里云上备份, 同时秉承严格的安全标准和隐私保护措施, 解决用户对于数据安全性的后顾之忧。

「小冰的产品需要支持海量用户, 对存储扩展性上限的要求非常高, 底层存储需要支持百亿量级的数据。MongoDB 是我们应对这一挑战的重要技术支撑, 它提升了数据管理的灵活性和扩展性, 兼顾了研发效率, 同时降低了日常运维的复杂度。伴随着 AI 生成等人工智能技术的爆发, 数字人市场将迎来强劲增长态势。未来我们希望继续携手阿里云数据库 MongoDB 版, 构建用户和虚拟人的知识库, 进一步提升产品使用体验。」——小冰公司研发总监苏之阳博士

文章源自: MongoDB

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。