
一年内完成4次版本迭代、月活用户突破1亿、月任务交付量达2亿次。
2026年的AI办公赛道,早已告别了“大模型嵌入文档”的初级阶段。从各家厂商扎堆更新Office智能套件,到五花八门的Agent工具争相上线,行业一边在功能内卷中陷入同质化,一边也在苦苦寻找从“工具插件”到“原生智能”的真正跃迁路径。
而在这场竞速中,一个核心矛盾始终摆在所有从业者面前:一款过去以“随叫随到的工具属性”立足的产品,要转型为更主动的个人超级智能体,该如何应对用户使用习惯与心智认知的双重变化?
这是百度文库网盘联合发布通用智能体GenFlow4.0的核心命题之一。这个在短短一年内完成4次版本迭代、月活用户突破1亿、月任务交付量达2亿次的产品,正在把大众印象里“存文件、找资料”的基础工具,彻底改造成一个全端可用的个人超级智能体工作台。
提前三年的底层布局,跳出AI Office的同质化内卷
在这次发布中,全面升级的Office Agent是GenFlow4.0最受关注的模块。一句指令并行调度Word、Excel、PPT三大Agent,分钟级完成万字报告撰写、海量数据处理、专业PPT生成,这些能力直接击中了办公场景最高频的用户痛点。
不少从业者会将这次升级看作百度文库网盘对AI办公赛道的跟风入局,但在群访中,百度集团副总裁,个人超级智能事业群总裁王颖给出了不一样的答案:Office三件套的智能能力从来都是团队的核心布局,是通用智能体能力的核心落地场景,并非临时起意的赛道跟风。
这条差异化的路,早在2023年就已经埋下了关键的伏笔。
传统办公软件的核心竞争力,向来是深度打磨数十年的编辑器。但在AI原生时代,这套成熟体系反而成了能力升级的桎梏。王颖在群访中谈到,传统Office软件的编辑器有着严格的模式分离,天生对一站式的AI调用路径不友好,结构化的编辑器体系与大模型之间的通讯并不顺畅,是完全独立的两套体系。而百度文库在2023年的重构中,就直接拆解了传统编辑器的完整架构,打造出一套方便大模型直接调用的Harness体系。
正是这次提前三年的底层重构,让GenFlow4.0的Office Agent有了完全不同的落地逻辑。它不用在成熟的编辑器体系里修修补补,给文档工具加一个对话入口,而是从底层就适配了大模型的调用需求,让AI能真正深入到文档、表格、演示文稿的元素级编辑中。

面对“从GenFlow2.0到4.0迭代速度远超行业预期,为何突然深化Office方向”的疑问,王颖也给出了清晰的解释:团队从一开始就定下了做通用AI的产品路线图,这个核心架构从未改变。迭代节奏看似很快,实则只是随着大模型能力、工具生态的成熟,一步步落地最初的规划。这次重点强化Office三件套的升级,本质是因为团队看到了Office是用户的绝对刚需,使用频率、转化效率都是最高的,用户痛点也最集中,因此对这部分自建Agent能力做了更深的迭代。
更关键的是,这次升级彻底解决了早期Agent产品的核心痛点。GenFlow2.0曾推出七八种Agent记忆模式,需要用户手动选择适配,而4.0版本直接在意图识别和任务规划环节完成了模型自训练,模型会自主理解用户任务该用什么模式,判断该直接调用大模型、组装Agent还是调度已有服务,全程无需用户手动干预,真正实现了通用智能体的自然调度。
当所有Agent都在卷前端,它把根扎进了用户数据的全链路
当下的AI Agent赛道,事实上已陷入了前端交互的同质化内卷。几乎所有产品都在做技能调用、自定义Agent、长时记忆功能,用户打开不同的工具,看到的都是相似的对话界面、相近的功能列表,很难感受到本质的差异。
主流市场都在做@技能调用的前端交互,GenFlow却把记忆和Skill内置在产品里,未来会不会跟随主流路线?关于这个问题,王颖的回答戳破了行业内卷的表象:技能调用的能力,百度在2023年橙篇发布时就已经落地,这从来不是什么独创的新鲜事。GenFlow选择内置核心能力,是为了给普通用户提供开箱即用的体验,同时也给深度用户保留了自定义空间,支持用户把其他平台的Agent迁移过来,变成自己专属的Skill,本质是做了更全面的兼容。
而GenFlow4.0跳出内卷循环的核心,是它从一开始就站在了用户数据的起点与终点,这也是它和市面上绝大多数Agent产品最本质的区别。
在日常使用中,绝大多数AI Agent都面临一个无法回避的痛点:用户需要把分散在各个平台、本地文件夹里的数据,手动上传到对话窗口,才能让AI基于这些内容完成任务。几个GB的视频素材、数十份采访文档、上百张活动原片,光是上传下载就要耗费大量时间,更不用说跨工具之间的数据搬运。
百度个人超级智能事业群国内业务负责人钟昊用完整的用户使用路径拆解了这个痛点的解法:用户在日常存储、上传文件的过程中,网盘的电脑端、手机端就已经完成了个人数据的实时同步,包括文件、相册、拍摄素材,这个过程用户完全无感知。而这正是通用智能体落地的核心前提——市面上的ChatBox类产品,只能做到有感知的数据同步和个人信息沉淀,而GenFlow直接打通了云端与本地的数据壁垒,智能体可以直接在云端虚拟机环境中工作,调用用户授权的文件数据,再调度对应的工具完成全流程任务,用户不用在多个软件之间反复切屏、搬运数据。
这种数据闭环的能力,也让GenFlow的记忆体系有了更扎实的落地基础。很多Agent产品的记忆功能,都面临着“记不住不够用,记太多又干扰当前任务”的两难问题。百度个人超级智能事业群应用研发负责人杨在申披露了记忆中心升级的核心技术细节。团队从三个维度构建了完整的记忆体系:用户长期的职业、身份画像,比如教师和宝妈对同一句话的意图理解会有本质差异;GenFlow任务上下游的上下文规划,保证连续对话的逻辑不中断;还有百度域内的用户行为痕迹,进一步刻画用户的偏好。
同时,团队通过Session Segmentation算法完成精准的会话分割,能自动识别用户任务的切换,比如上一分钟还在聊旅游规划,下一分钟突然问起专业数据问题,算法会自动完成场景区隔。再配合适配大模型窗口限制的架构设计,对记忆内容做合理的压缩与精简,既保留了长期记忆的连贯性,也避免了冗余信息对当前任务的干扰。
针对行业内同类文件管理Agent普遍存在的痛点,钟昊也出了明确的解决方案。当下很多“龙虾”类工具,在超大批量文件整理时容易出现幻觉,明明把文件放在了D文件夹,却告诉用户存在C文件夹,导致用户后续找不到文件;同时对文件的复杂操作不可逆,修改文件名、移动位置甚至删除后,无法恢复到之前的状态。
为了解决这些问题,GenFlow在文件管理能力上做了全链路的操作记录,支持文件夹状态的一键回退,哪怕是文件名修改、文件位置变动、内容删除,都能恢复到之前的版本,让用户能放心地把文件管理交给AI,不用担心里程碑版本丢失。
个人超级智能体的终局,是覆盖全场景的生产力中枢
GenFlow4.0的发布,是百度文库网盘升级为个人超级智能事业群后的第一次正式亮相。王颖在采访中谈到,这次组织调整带来的最大变化,是整个业务的战略格局彻底打开,战略目标和路径更加清晰,整个团队的核心方向,就是要跑赢大模型的迭代周期,拿到这一轮技术变革的红利。
为了支撑这个目标,团队已做了彻底的组织结构调整:国内业务打通文库与网盘,应用技术全部拉通,保证产品能力同步迭代;基础架构与安全体系同时覆盖国内、海外与To B全场景,在To B赛道做深做实。而这个战略调整的落点,早已超出了个人办公的单一范畴。
关于GenFlow的核心定位,王颖给出了清晰的答案:通用智能体的核心,就是横轴做宽,纵轴做深。横轴上,把服务链路做宽,覆盖网盘的办公、学习、生活、娱乐四大板块;纵轴上,把每个垂直场景做深做厚,完善全链路的服务能力。这次发布重点讲了Office Agent,只是因为办公学习场景的全链路能力已经打磨完整,而视频剪辑、图片处理等生活娱乐场景的能力,也会在后续陆续落地,其中视频剪辑Agent就会在今年的百度Create大会正式发布。
在To C端,GenFlow已经从“随叫随到”的工具,变成了能主动理解需求、规划任务、推进执行的个人智能中枢。除了核心的Office Agent,AI练题、AI看点、AI求职、AI照相馆、AI相簿等能力已经在网盘陆续上线,既可以做用户的工作学习助手,也能覆盖生活娱乐的全场景需求。
在To B端,团队则瞄准了传统协同办公产品覆盖不到的增量市场。王颖提到,当下主流的协同办公平台,大多是面向中大型企业的重模式,内置了复杂的审批、报销、财务系统,但3-10人的小团队,核心需求从来不是这些重功能,而是用最简单的方式实现生产力提升。百度网盘推出的团队版,恰好踩中了这个需求,即便还处于灰度阶段,没有全面放开,注册的组织已经超过1万家。
这套团队版能力的核心逻辑,就是“把Agent搬到数据里,而不是把数据搬到Agent里”。绝大多数团队的素材、文档、项目资料,本就沉淀在网盘的团队空间里,数百项专业Agent可以直接在原地工作,天然继承团队的目录权限、协作历史,不用反复上传数据、重新配置上下文。品牌活动结束后,5分钟就能完成数百张原片的分类、修图、配图匹配与交付;内容营销的全流程工作,从视频切片、文案匹配到分发计划、数据复盘,13分钟就能全部完成。
这些能力让AI从偶尔调用的工具,变成了24小时在岗的团队成员,按照规划,今年5月底,百度网盘还将正式发布团队版“Agent协作军团”,把这套能力进一步完善落地。
海外市场,则成了这条增长曲线的第二极。钟昊介绍,文库海外版Oreate上线后,产品规模一直保持高速增长,海外市场确实验证了团队最初的判断,把Office Agent能力、多模态能力快速上线后,获得了用户的高度认可。王颖也补充道,国内外用户最核心的区别,就是海外用户更愿意为好的应用、好的产品买单,付费意愿远超国内市场,经常有海外用户写信过来表达对产品的认可。
在她看来,随着大模型解决了语言壁垒,中东、南美、东南亚这些AI渗透不均衡的市场,将成为接下来的核心增长洼地。不同国家的交互习惯、审美偏好需要适配,但随着AI Coding能力的提升,这些都不再是核心障碍,海外市场有极大的深耕空间。
移动互联网时代诞生的工具型产品,在AI Native时代都面临着同一个转型难题:是在原有产品的框架里加一个AI入口,守住现有的用户心智,还是彻底打碎自己,重构一套适配AI时代的产品逻辑?百度文库网盘用一年四次的迭代,给出了自己的答案。
AI办公的终局,从来不是比拼谁的功能更多、谁的技能库更全,而是看谁能真正成为用户的个人智能中枢。
当用户的所有知识资产、数据沉淀,都能和AI能力形成完整的闭环,不用在多个工具之间反复横跳,只用一句话就能完成从数据到成果的全链路交付,这才是通用智能体真正的价值。而GenFlow4.0的探索,正在给整个行业,趟出一条全新的路。



