从线上 K 歌到元宇宙,「实时互动」的八年进化

摘要

从 RTC 到 RTE,一个「基建」公司的历史视角。

「你有多久没去 KTV 了?」这个词条隔一段时间就上一次热搜,KTV 都快成「时代的眼泪」了。

疫情压抑了大量线下 K 歌需求,却压抑不了麦霸们爱音乐的心。于是线上 K 歌房这个「古老」的行业再次迎来生机。

遥想当年 KTV 里的麦霸们,除了爱音乐,其实还爱互动。如今的在线 K 歌房也进化出了多种玩法满足互动需求,全方位还原 KTV 里的嗨歌场景,不只能录歌,还有如抢唱、接唱为主的依次互动类玩法,斗唱、合唱为主的实时互动类玩法。

从当年的「YY 语音」到如今的「全民 K 歌」,这些语聊和 K 歌类应用看起来功能简单,但是当用户数是千万乃至过亿量级的时候,最简单的底层实时音视频功能,都会变成很大的技术挑战。

应用倒逼基础设施推进,是国内科技互联网的常态。实时音视频互动技术的发展带出大量的场景,也成就了那些针对不同场景的大中小创业公司。

应用倒逼基建,再到如今深入场景,实时互动领域发展的全过程中,声网举办了八届的实时互联网大会,如同行业风向标,全程参与、见证和带动了实时互动行业的发展,同时在每年大会上都有着对行业的发展的总结和预判。

不久前的 RTE 2022 第八届实时互联网大会上,声网通过发布的 RTE 行业首本专业书籍《实时万象》,披露了超过 200 个实时互动应用场景,以及众多热门场景在全球市场的发展情况,并首次揭秘了声网的音视频大数据,为全球 RTE 行业的开发者与创业者提供一个全面的借鉴与参考。

同时,在对实时互动要求与日俱增的当下,声网也在今年的大会上给出了实时互动「基建」未来的愿景。



01「实时」场景的演变



对于很多做音视频的开发者来说,应该会记得,声网是首个将 RTC(Real-Time Communication 实时通信)技术能力提供给企业和开发者的公司。

在 2020 年,声网在上市招股书中首次公开提出「RTE」(Real-Time Engagement)概念,此后这一概念逐渐被全行业认可及使用。

从 Communication「传递」到 Engagement「参与」,实时音视频技术从幕后参与到了更多场景中。今年的 RTE 2022 第八届实时互联网大会对 RTE 技术能覆盖的内容进行了进一步的扩大衍生,从实时音视频技术的基础能力向更多的场景化能力扩展,RTE 概念与边界也已逐步清晰化,更加聚焦场景。

声网创始人兼 CEO 赵斌认为,RTE 内涵和外延的范围远远超过了 RTC 的领域,「RTC 从 Communication 的视角,更多强调对语义信息进行高质量和高效率的传递。而 RTE 更聚焦用户所需要的共享时空,即俗话所说的场景,并且能够达到或者超越线下场景的互动体验和效果。」

如其所说,RTC 到 RTE 不止概念的变化,更和应用场景的发展紧密相关。传统的 RTC 概念,从信息传递的角度出发时,更集中于视频会议、直播、音视频通话、在线课堂等场景,而近几年创新场景层出不穷,已经远超想象,例如健身镜、平行驾驶、云蹦迪、虚拟演唱会等等。


今年 RTE 2022 第八届实时互联网大会上发布的《实时万象》里详细解析了 200 多个场景,不仅有在线 k 歌,还遍布泛娱乐、IoT、教育、金融、医疗、企业协作等 20+ 行业赛道,大量 RTE 场景正在快速生长。

比如当前很多火热的实时互动场景都搭上了元宇宙顺风车。今年 7 月,加拿大「元宇宙」线上体育社区 Stadium Live 完成 1000 万美元 A 轮融资,估值飙升至 3200 万美元。在 APP 上,用户不仅能沉浸式观看赛事直播,还可以在社区中与众多球迷线上实时交流,且可以创建虚拟化身,穿上球衣、打扮成球星、征召球队。

Stadium Live | 来源:TechCrunch


实时互动技术助力的 Stadium Live 式沉浸式观赛体验,不止球迷之间可以交流,甚至还能影响赛场中的运动员。用户通过手机、电脑等移动设备,「加入」体育场内正在进行的大型体育赛事,为现场参赛人员呐喊助威、欢呼鼓掌的这些声音,都可以通过扬声器实时回荡在赛场上,在设备外也能让喜爱的队员听到自己的声音。

和体育直播类似,线上演唱会也不仅只能单向观看了,更真实、自然、沉浸的线上演唱会体验已经出现——在虚拟演唱会的世界中,你拥有自己的虚拟化身,坐在线上虚拟坐席上,可以与现场场馆的大屏连线实时互动,在家中挥舞的应援棒也可以让偶像看到,甚至还可以在虚拟演唱会中与偶像共创舞台。

在当前元宇宙畅想层出不穷的时刻,更为重要的是扎实进行对下一代互联网的基建。RTE 就被认为是元宇宙的一项底层技术,元宇宙所需的自然交互和沉浸参与,都离不开实时互动。RTE 2022 大会上更深入挖掘出了这些火热的元宇宙场景所需的底层技术。

其中空间音频技术已经在元宇宙话题中被反复提及,其对于元宇宙的重要性被认为或将远超其在互联网 2.0 时代的作用。如果认为空间音频就是立体声或者左右声道,就小看了未来在虚拟空间里人能从声音里得到的沉浸感。在 RTE 2022 实时互联网大会上,赵斌聊到,「人的耳朵是一个超级敏感的器官,除了左右方位,还有空间大小、距离远近、空间塞满物体还是比较空旷等等。这些如果跟真实有差异,在元宇宙场景下的现场感、沉浸感和真实感就会有大大的损失。」

在 AIGC 取得令人振奋的突破发展之外,其实 AI 近一年在音频领域也有着巨大进化。AI 降噪、AI 回声消除、空间音频等音频的新技术能力给各种场景带来了更加纯净和沉浸的听觉体验。赵斌称,「我们很高兴看到 AI 降噪在过去一年取得了突破性进展,和传统的 DSP 算法相比,AI 降噪能有效地降低各种突发式、不持续、甚至不规律的噪声信号。」


02 实时互动行业风向标



随着 RTC 概念升级为 RTE,实时互联网大会名称也于 2020 年从「RTC 大会」升级为「RTE 大会」,这场大会已经从最初单纯地以技术布道为目的,逐步升级为技术内核、聚焦场景的行业峰会。

第一届实时互联网大会举办之时,实时音视频技术在国内还处于「三无」状态,即:无行业会议、无专业书籍、无专业媒体及社区。在这样的背景下,刚成立不久的声网在 2015 年就将 webRTC 大会引入国内,成为整个亚太地区音视频技术大会的开创者。在第二年,声网独立举办实时互联网大会,并坚持一年一会。

从此,大会作为风向标一般的存在,伴随着实时互联网在各行各业应用的发展。

翻看最早的两届大会内容,主题分别叫做「沟通无限」和「快速崛起」,当时实时互动需求刚刚萌芽,实时音视频技术还在跟网络问题、设备问题较劲,需要解决基本的噪音、回声问题。在应用层面,讨论还在「微信上越来越多的用户愿意使用实时语音功能」和「实时语音已经达到可以商业化的地步了」的阶段。

八年过去,语音质量问题已经不再困扰很多基础场景,实时语音早已发展成实时音视频,实时互动也早已在千行百业中发挥出了远超微信语音意义的作用。

伴随着实时互动赛道的发展,大会内容也在这八年间不断衍生,逐渐从技术蔓延到行业、产品、生态、创业、企业责任等各个领域。

技术内容始终是实时互联网大会的核心,在以实时音视频、实时通信相关技术作为核心的基础上,结合每年开发者关心的不同技术热点,在分享内容上做了更多延伸,例如 ARVRAI、机器学习、5G、Flutter 等等。

从声网举办实时互联网大会的第一年到 2019 年,是移动互联网快速发展的几年,实时互动技术应用也随着移动互联网的发展覆盖到越来越多的行业、场景,在这期间,每一年的实时互联网大会几乎都准确预言了未来 1-2 年行业的发展趋势,见证和预言了众多实时音视频技术之于互联网发展的关键时刻。

当年赵斌对电商直播的预判就先市场一步。2017 年,在实时互联网大会主论坛上,赵斌在分享中提出,直播可以成为电商进一步发展的手段,直播形式可以更好重现线下购物体验,帮助商家全方面推广产品,帮助消费者更方便地选择产品。当时,电商直播还是一个新兴场景,到 2018 年,电商直播就开启了势头,直到现在电商直播已经成为每个电商应用的标配。

2020 年一场突如其来的疫情出现,将很多线上场景融入到人们的日常中,加速了实时互动技术的落地需求。视频会议、远程医疗、远程面试、电商直播……大量场景一夜之间成为生活工作的必需品。RTE 概念在这样的背景下诞生,实时互动成为快速增长的新兴行业赛道,大会也随之升级,内容覆盖与 RTE 相关的更多领域。

同时,2020 年 RTE 大会期间,声网联合五源资本等知名投资机构,发起了第一届实时互联网创业挑战赛。通过借助资本的力量,发现更多独角兽、加速创业者在实时互动方向的创新和成长,也让这个行业更加繁荣。后来声网将创业挑战赛升级为创新大赛,一直延续至今。

2021 年,实时互联网的玩法更加丰富多样起来,社交直播、狼人杀剧本杀等语音游戏、clubhouse 等互动播客、全景教室以及各类元宇宙场景走入人们生活中。

在当前元宇宙「新基建」时刻,RTE 大会依旧是行业风向标。在此时元宇宙实时互动技术的「新基建」中,RTE 大会依旧是行业风向标。2021 年是元宇宙元年,声网便在这一年的 RTE 大会上打造了沉浸感十足的专属元宇宙展区。参会者不仅能体验到 HTC Vive、Rokid 等 AR 设备、创幻科技虚拟偶像体验,还有撸猫机、喂鸟机、智能机器人等丰富的 IoT 设备。

同时,2021 年的 RTE 大会聚焦于实时互动场景,关注实时互动在各行各业的落地与前瞻,发布了基于实时互动场景的「RTE 万象图谱」,这也是行业首个 RTE 全场景雏形,并在今年集结成书《实时万象》。

技术迭代,场景爆发,大会的初心——帮助开发者——始终未变。当初刚成立不久的声网引进 webRTC 大会时,便是为了解开发者的实际需求,帮助他们应用 RTC 技术。「无论 RTE 大会所辐射的内容做了多少延伸,我们的初心始终是服务好开发者。」声网市场副总裁彭小欢在大会上表示。

如今在和开发者的共同努力下, RTE 大会已经成为开发者一年一度必参加的行业年会,成为了全球范围内规模最大、最具影响力的音视频行业峰会,累计影响开发者超过 200 万。

能够做到全行业的开发者都认可的大会,是因为这场大会本就是开发者办给开发者的。在声网,员工很多也都是开发者,彭小欢表示,「开发者最了解开发者的实际需求,爱分享切磋、很极客、热爱前沿技术、追求效率、擅于创新等等需求在 RTE 大会中都能得到满足。」

不管是当前互联网流量聚集地视频直播,还是未来的元宇宙场景,人们对实时互动的视听体验追求只会越来越高,如果没有 RTE 作为实实在在的基建能力跟上这样的潮流,愿景都将难以实现。比起当年的「语音」时代,这样的基建或许更为迫切,同样能预见的是,回报也更大。

作为行业风向标的 RTE 大会,既是基建的主力承建方,也是基建中的一环。手握技术、落地场景的声网,显然已经做好了进入未来新市场的准备。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表具有科技的商业洞见。