
近日,快手技术沙龙第四期在北京举办。
近日,快手技术沙龙第四期在北京举办,本期沙龙以「快手生成式推荐技术的体系化演进——统一基座、池化预估与场景实践」为主题,围绕 OneReason、Pool-Rec、OneSearch V2、GR4AD 等核心技术实践,系统分享快手在生成式推荐领域的最新探索。
活动上,「快手探索者 LLM-Rec 挑战赛」正式发布。该赛事由快手与 ACM SIGIR 2026 联合举办,聚焦大模型与推荐系统融合,面向全球范围内各类院校的全日制在校学生开放,参赛者不限国籍、院校和专业。

快手探索者 LLM-Rec 挑战赛正式发布
活动上,快手基础大模型与应用部、推荐模型部负责人李晗正式发布「快手探索者 LLM-Rec 挑战赛」。赛事希望通过开放真实场景和前沿课题,进一步加速大模型与推荐技术的深度融合。快手鼓励参赛者将推荐模型与大语言模型的优势相结合,探索推荐系统迈向更高阶智能的可能路径,让更多优秀想法不仅停留在论文层面,更能够被验证、被实践、被看见。

OneReason:当推荐系统学会思考
OneRec 系列生成式推荐模型已在多个业务场景中实现规模化落地,释放了 next-token prediction 框架下的 Scaling 收益。推荐系统下一阶段的关键问题,是如何让模型不仅「生成结果」,更能够「理解原因」与「完成推理」。
快手推荐模型部生成与排序模型负责人唐睿明分享了 OneReason 的核心思路:生成式推荐模型要进一步获得类似大语言模型深度 Reasoning 所带来的能力跃迁,需要面向推荐场景系统性构建推理能力。团队搭建了面向推荐任务的 CoT 数据体系,以激发模型在推荐过程中的真实推理能力;同时在推荐任务的 RL 阶段引入 Reasoning 数据飞轮,通过多轮迭代持续优化 CoT 质量,实现推荐场景中模型推理能力的大幅提升。
OneReason 的探索,标志着生成式推荐正在从 Scaling 走向 Reasoning,也为推荐系统在复杂场景下的决策能力升级提供了新的技术路径。

Pool-Rec:基于异构算力池化的推荐预估系统
生成式推荐模型的持续 Scaling 对底层算力供给、推理架构与系统效率提出了更高要求。快手计算引擎架构负责人柳嘉强介绍了基于异构算力池化的推荐预估系统 Pool-Rec:通过基础设施、算力调度与推理引擎的系统升级和协同优化,实现 AZ 级异构资源的统一池化与弹性供给。
该系统大幅提升了模型算力利用率 MFU,并推动推荐预估系统向高密 GPU 架构和分布式推理方向演进,不仅支撑了 OneRec 系列生成式模型的工业级落地,也为推荐模型持续 Scaling 提供了高性能、高效率、可扩展的系统底座

工业级生成式搜推的下一阶段:从生成候选到生成决策
生成式检索与推荐正在从前沿探索走向工业主链路,真正的挑战已经不再只是「能否生成候选」,而是如何让模型具备复杂意图理解、推理决策和偏好对齐能力。快手货架电商推荐与搜索负责人杨一帆结合 OneSug、OneSearch V1、OneSearch V2 等 One 系列工业实践,系统梳理了生成式搜推从 query 生成、item 生成,到推理能力内化和生成决策的演进路径。
在电商场景中,用户需求表达往往具有模糊性、多样性和强上下文特征,生成式搜推框架则通过更强的语义理解和生成能力,为复杂意图建模和商品匹配带来新的可能。面向下一阶段,兴趣编排、搜推一体和主链路闭环,将成为生成式搜推继续突破的重要方向。

GR4AD:生成式广告推荐的工业实践——从 Token 到 Revenue
如何将生成式推荐能力转化为可验证的商业增长?快手商业化直播模型与内循环召回负责人吴文金分享了 GR4AD 的方案:以 OneRec 的 decoder-only 架构为基础,结合广告业务特点,围绕表征、学习与服务三大层面进行协同优化——引入多模态语义主成分 ID 增强模型对广告内容与用户兴趣的表达能力,提出懒惰自回归 Lazy AR 与价值感知学习对齐业务目标,建设商业化实时训练与推理服务体系保障在大规模线上场景中的稳定落地。
目前,GR4AD 已在快手广告平台完成全面落地,并取得显著业务收益。

站在推荐系统新一轮范式变革的节点,生成式技术正在推动工业级智能系统从「精准匹配」走向「理解、推理与决策」。未来,快手也将围绕统一技术基座、推理增强和系统效率持续探索,推动生成式推荐不断向前演进。

与此同时,「快手探索者 LLM-Rec 挑战赛」已正式启动。本次挑战赛面向全球范围内各类院校的全日制在校学生开放,快手期待与更多青年技术人才一起探索生成式推荐的未来,共同定义下一代智能推荐系统。
来源:互联网



