
从走出「微笑曲线」到即将「上春晚」求爆发。
12月24日,有报道称豆包的日均活跃用户数(DAU)已突破1亿。加上前两天豆包要上春晚的消息,看起来,豆包离一款国民级应用的距离越来越近了,而这也让所有怀疑Chat是否是AI时代超级入口的讨论,变成了“面向未来的终局探讨”,今天,字节已经用行动表明了自己的明确判断。
此前据报道,字节跳动旗下火山引擎将成为 2026 年中央广播电视总台春晚独家 AI 云合作伙伴,其智能助手豆包也将配合上线多种互动玩法。
有着十亿观众规模的春晚,依然是「流量放大器」,只是这次主角变成了 AI 应用。
十年前,微信摇一摇抢红包登上春晚,微信红包一举创下了达10.1亿次的收发总量,摇一摇互动峰值更是达到每分钟8.1亿次,此后,微信开始跟「国民级」应用画上了等号。
更早之前,火山引擎近日宣布豆包大模型日均 token 使用量突破 50 万亿,较去年同期增长超 10 倍。而根据 QuestMobile 发布的 2025 年三季度AI应用行业报告,豆包以 1.72 亿月活用户(MAU)力压 DeepSeek 的 1.44 亿,登顶国内 AI 应用榜首。
在这些宏大的流量战报与榜首光环之外,极客公园也发现了一组看似不起眼、却更能决定 AI 产品存亡的微观数据。
一个是Sora app 60天留存0%,一个是豆包 180 天留存率竟反超 90 天留存率,这是在2025年年底,我们了解到的两款AI产品大相径庭的留存曲线。

Sora app 60天留存0%|图片来源:X
虽然这两个产品分属不同的赛道,一个是垂直类的视频生成工具,一个是全能型的 AI 助手,但我们或许可以从这个鲜明的对比走向里,看出AI 应用从「技术尝鲜」迈向「场景落地」的必然规律。
在算法祛魅的下半场,谁能率先用「产品思维」解决生老病死、衣食住行的真实需求,谁才有可能将流量转化为真正的用户护城河。单纯基于「想象力」的技术炫技,越来越难以逃脱「用完即走」的宿命了。
豆包的表现,正在验证一个事实:在 Agent(智能体)时代,Chat 依然是通往超级应用的最佳入口。
1 豆包:走出微笑留存曲线
通常情况下,AI Chat类产品由于缺乏深度的用户忠诚度,往往面临「用完即走」或留存率持续下滑的困境。
然而,豆包在发布相当长一段时间后,却走出了一条罕见的「微笑曲线」——有网友在即刻称豆包Q2的新用户安装留存率,在Q4出现了翘尾现象。180天留存>90天留存,留存数据出现回暖和「翘尾」现象。

图片来源:即刻
那么,在这期间,豆包发生了些什么?

豆包在今年下半年以来的更新(一)|图片来源:极客公园

豆包在今年下半年以来的更新(一)|图片来源:极客公园
回顾豆包下半年以来的更新,会发现一个明显的趋势:它变得越来越「长眼睛」了 。
更新的重点不再局限于文本对话,而是大量围绕视觉的生成与理解展开。特别是图片处理(P 图)、修图及换背景等功能,精准切中了年轻女性用户的刚需,甚至在一定程度上成为了「美图秀秀」的 AI 替代品。
这正是字节跳动最擅长的打法——用多模态技术重塑经典场景。
过去,Chat 类产品的核心痛点在于「悬浮」:用户来这里主要是为了闲聊或娱乐,这种基于想象力的交互很容易枯竭。但当 Chat 接入了强大的多模态能力,它就具备了「干活」的能力。
豆包还展现出了一种「旧模式升级」的智慧。与其凭空创造全新的交互,不如去挖掘那些曾在移动互联网早期(如 2017-2018 年抖音爆发期)被验证过的热门玩法。
不仅是修图,豆包将 AI 的能力嵌入到「老照片修复」、「静态照片动起来」等打情怀牌的场景中,击中了用户为孩子庆生或怀念逝去亲人的情感软肋。
还有视频通话的进化,之前火爆的「虚拟好友打电话」功能,其实早在去年 11 月就已上线,前段时间又通过体验优化被用户重新发掘。
这种「内容驱动增长」的逻辑,本质上是寻找那些具有普适性的场景,用 AI 做到极致体验,从而激发用户的自发传播。同时,这种从「闲聊式」的弱连接,向「得力工具」的强连接的进化,或许正是豆包阶段性留存率回暖的关键。
火山引擎总裁谭待提到,字节跳动的一个很大优势就是「比较会把体验做好」。他认为,在 AI 时代,Agent 让个体体验变得关键,能否让用户用得顺手,是产品存活的核心。
而据业内人士透露,在豆包内部,这种判断标准变得更加务实:一个新功能是否成立,不再看大厂员工的内测反馈,而是进行「盲测」——找 10 个完全不懂技术的普通老百姓,如果其中有 7 个人不仅愿意用,还产生了忍不住「剁手」分享的冲动,这才是一个合格的 Aha Moment。
2 底层进化:让 AI 从「能玩」变「有用」
应用层的「接地气」,离不开底层模型能力的质变。豆包之所以能接住这些高频图像和语音需求,是因为其底层模型在今年下半年迎来了从「Demo 级」到「Product 级」的跨越。
今年下半年,豆包大模型迎来了多轮关键迭代,涵盖长文本、深度思考(多模态)、视频/语音生成、Agent 能力等方面。
首先是架构的统一与成本的优化。 6 月发布的豆包 1.6,首次将深度思考、多模态、长上下文能力统一进同一套稀疏 MoE 架构。谭待透露,火山引擎通过技术手段将模型推理价格降低了 99% 且依然保持毛利。 这意味着,在大规模 C 端应用中调用多模态能力的成本不再是天价,为「免费 P 图」提供了商业可行性。
其次是视觉能力的生产力化。 谭待认为,多模态代表着模型应用进入更深的领域,输入和输出往往都带有视觉信息。 9 月推出的 Seedance 视频生成模型,其在中文及方言的音画同步(如口型匹配、不吞音)上表现全球领先。这直接解决了过去视频模型「对不上嘴」的痛点,成为「虚拟通话」等实时互动场景体验爆发的技术基础。
最后是基于强化学习的自我进化。 火山引擎智能算法负责人吴迪在演讲中提到,强化学习是让智能体自我进化的关键。以抖音客服为例,通过构建虚拟环境和剧本进行强化学习,模型的问题解决能力提升了 10 个百分点。这种技术让豆包不仅仅是「答题」,更具备了解决复杂问题的「进化力」。
3 Chat :目前依旧是超级入口
豆包的阶段性成功,验证了「Chat作为超级入口」这一逻辑的可行性,Chat 并不会过时,它只是需要更强的手和眼。
在Agent(智能体)时代,Chat不再仅仅是聊天窗口,而是调用各种工具能力的调度中心。
谭待也提到,豆包 APP 的表象之下,本质上是一个「特别复杂的 Agent 集合」。他认为,未来的交互方式——无论是手机还是车机——都会是「自然的以 Agent 的方式」进行。
比如在车里,以前的指令很笨(必须说「打开遮阳板」),现在基于大模型的多模态 Agent 可以理解「把天窗开一下」其实是想打开遮阳板,甚至能理解「想听那首什么歌词的歌」这种模糊指令。
多模态能力让这个调度中心拥有了干涉现实的能力。通过整合视觉理解、图像处理等能力以及电商链接等功能,可以看到,豆包正在尝试走通一条「大一统」的超级应用之路。
在阿里通义千问、DeepSeek以及海外竞品都在激烈争夺入口的背景下,豆包这种「系统性」的打法及其取得的成果,为行业提供了一个关于「AI 入口如何 Make Sense」的重要样本。谭待预测,明年 Agent 将迎来爆发,仅企业内部的 Agent 数量就将从几十个增长到几百个。
据业内人士透露,豆包的竞争重点或将从「模型竞赛」转向「大众实用功能」。
一方面,产品团队正在吸纳更多 95 后、网感好的年轻人,试图复刻更多类似「虚拟视频通话」的爆款功能;另一方面,产品开始聚焦更具社会价值的民生场景,如央视《赢在 AI+》所倡导的方向,利用 AI 寻找走失儿童、服务视听残障人士等。
当 AI 能够真正解决「寻常百姓家」的具体问题时,产品才能真正穿透技术壁垒,构建起长效的用户护城河。
豆包在用户留存上出现的微笑曲线,或许意味着未来AI产品的分水岭,将取决于谁能更好地通过Agent能力解决实际问题,从而将流量转化为真正的用户价值。
而当 Chat 成为调度万物的指令行,它可以不再只是一个 App,而是通往 AI OS 的雏形。



