
导读 当前广告推荐领域正面临效率瓶颈与体验优化的双重挑战。传统推荐模型依赖后链路用户行为数据训练,易形成信息茧房与效率瓶颈,同时面临内容冷启、用户冷启难题,广告主素材内卷还导致三方负向博弈。在此背景下,广告推荐技术历经三次范式革新:早期依赖人工特征工程与规则引擎,适配场景有限;后进入深度学习时代,通过 FM、DIN 等模型实现用户 - 商品匹配效率跃升,但受限于数据闭环与冷启动难题;如今随着大模型技术突破,其多模态理解、跨域知识迁移与自然语言推理能力,正为破解广告精准触达困局提供全新技术路径。
将会围绕以下 3 点展开介绍:
- 传统推荐模型-数据基建的“精耕细作”
2. LLM4REC-数据基建的“语义化跃迁”
3. 未来规划
分享嘉宾|钱英男 快手 商业化以及生活服务数据服务中心负责人
编辑整理|成亮
内容校对|郭慧敏
出品社区|DataFun
01
传统推荐模型-数据基建的“精耕细作”
在商业化广告这一互联网平台核心营收领域,广告分发的全链路对数据和算法推荐有着极高诉求。商业化广告的完整分发链路,分为投前、投中、投后三个关键阶段:
- 投前阶段:广告主在投放平台创建广告并上传素材(图片、短视频、直播等),随后媒体侧会对素材进行 “创意优选与索引” 处理,通过 “一阶段优选→二阶段裁剪→索引池”的流程,为后续分发做准备。
- 投中阶段:依次经历 “召回→粗排→精排→混排→竞胜”的链路,用算法为广告素材匹配最可能转化的用户。
- 投后阶段:完成广告下发与计费后,通过“闭环链路数据回流”和“非闭环链路客户回传”将数据沉淀至模型训练,反向影响投前和投中策略。

传统推荐模型以 DIN、DIEN 为代表,核心是基于“用户 - 物品”交互历史学习排序函数,技术栈成熟、可解释性强,在流量稳定、行为数据丰富的成熟业务场景效果稳定。数据特征层面需从广度密度、特征交叉、序列行为多维度发力,聚焦覆盖率、实时性与精准度。模型依赖后链路行为数据训练前链路召粗精排模块,虽通过拓展数据源、优化标签与模型结构持续提升转化效率,但受 “自身数据闭环学习”限制。

传统多阶段推荐系统的两种自闭环及由此引发的内容冷启、用户冷启问题。第一种自闭环是推荐内容经用户曝光、转化等行为后,作为样本回流训练召回、精排等模块,形成推荐与用户的闭环;第二种是召回、粗排通过 Learning to Rank 学习精排、混排的打分排序,形成多阶段级联模块内部闭环。
这两种闭环导致内容冷启时,新品因无用户交互历史数据,模型效果差、效率低,难以助力商家拓展潜在人群;用户冷启时,无商业化广告转化行为的用户因缺乏兴趣标签,易形成马太效应,导致用户池范围缩小,广告主预算流失。这些问题对商业化平台生态健康和长期利益损害显著,因此需探索大模型在推荐算法中的应用以挖掘增量信息解决冷启难题。

02
LLM4REC-数据基建的“语义化跃迁”
广告主为追求转化效率,会重复创建大量相似甚至相同的商品素材以博分发效果,这导致媒体侧模型样本稀疏、预估不准确且不稳定,进而刺激广告主更疯狂卷素材,形成 “堆素材 — 难起量 — 堆素材” 的负循环;同时用户侧看到的商品多样性差,易被重复内容打扰。这种负向博弈对三方均不友好。方案思路是回归内容和商品本身,在内容与商品维度进行分发,解决素材重复问题,保障新内容、素材冷启成功,以此提升投放确定性,缓解物料膨胀带来的资源和效率问题。

在短剧行业,存在广告主为提升 ROI 大量卷素材的问题,通过以下三个案例展示大模型的识别能力:Case1 是同剧不同名,经大模型内容理解后判定为同一部剧;Case2 是剧名不同且剧集剪辑换序,大模型仍能识别为同一故事剧情;Case3 是短剧名字相同但大模型判定为不同剧。

技术实现上,对于不同名但内容一致的情况,抽取剧集中的音频、文本内容,利用 OCR、ASR 能力生成 embedding;对于剪辑换序的情况,通过多模态处理能力对视频内容进行 embedding 化,再整合文本和视频的 embedding 信息形成统一 ID。最后采用 graphframe 图计算方式判定剧集是否为同一部,解决了向量检索阈值难把控的问题,在短剧行业实现了 97% 的准确率(较老版本提升 13%),并应用于快手的风控和检索池判重。 此外,大模型还用于 item 深度刻画,助力商品和内容冷启。

针对用户广告场景行为稀疏、推荐系统信号少、预估难度大的业务问题,聚焦 ITEM 找人破圈方案。传统物找人思路(协同过滤、双塔召回、lookalike)因依赖 item 丰富交互信息,在冷启方面表现不佳。
解决方案有二:方案一是对冷启的内容商品进行多模态理解,通过识别、抽帧等方式扩充标签和信息,例如对视频类内容利用 OCR、ASR 等能力提取信息,输入大模型增强刻画;方案二是在方案一基础上,对冷启内容或商品信息进行相似扩展,召回相似的高频内容商品表征,转化为用户序列特征,以此泛化触达潜在人群。通过这些方案,可助力冷启商品更高效地找到目标用户,提升推荐系统在行为稀疏场景下的预估能力。

以医疗行业表单类广告为例,展示大模型在冷启商品信息扩充中的应用。原始落地页仅含 “中医养生大课堂”“教育行业” 等少量信息,模型难以精准判断目标人群。通过点击落地页后的 H5 页面,利用大模型 OCR 能力解析其中内容,可提取出课程地区(山东)、教学形式(线上直播加录播)、目标人群(上班族、中老年人)、类目(中医养生课堂)等丰富信息。将这些信息输入模型后,能助力精排序模型更精准地识别潜在用户,解决冷启商品因信息不足导致的推荐困难问题,提升广告转化效率。

通过语义 ID 进行 i2i 召回,并结合用户行为交叉生成更多用户侧特征,实现语义 ID 的泛化。在特征化过程中,对语义 ID 的多层进行 hash 和拼接,充分利用每层信息并与用户行为交叉,精细化提取语义表征。同时,将用户与商品的语义 ID 化表示进行叉乘,且按用户行为时间点有序聚合,类似传统模型的序列化处理,使模型效果在业务 AB 实验中得到提升,助力解决用户冷启等场景下的推荐难题。

聚焦 LLM4REC 在用户冷启场景的应用,解决用户广告行为稀疏、推荐系统信号少的问题。方案思路是聚合用户基本属性、主站内容消费行为(如观看、点赞、评论视频)、电商场域消费及搜索行为等信息,通过大模型三层 Prompt 结构推理用户兴趣:system prompt 明确角色为商业化推荐算法专家,要求基于用户综合信息推断商品兴趣;user prompt 组装用户各类行为信息;instruction prompt 要求输出用户可能感兴趣的 10 个广告产品名(如选择 “product name” 颗粒度,聚焦商品本身而非素材或更细粒度 item)。通过大模型的知识与推理能力,精准刻画冷启用户兴趣,助力推荐系统高效触达目标用户。

围绕 LLM4REC 解决用户冷启的数据特征构造思路展开,包含三方面:推理颗粒度上,选择推理 Product name 而非 item id 或商品描述,因其更能代表用户转化本质、易泛化且兼顾推理效率与成本;自然行为跨域推理上,以用户主站自然域消费、基础画像等信息为主(若用户同时是商业化和自然域高活用户,结合双域信息推理效果最优),解决商业化广告域行为稀疏问题,打破传统推荐模型的信息茧房与自闭环;偏好优化上,对推荐商品 LIST 采用 DPO→GRPO 排序,并在 Reward Model 中加入商业转化目标深浅度权重,提升推荐精准度与转化效率。通过这些思路,借助大模型的知识与推理能力,高效刻画冷启用户兴趣。

03
未来规划
聚焦大模型在推荐系统中的应用演进与未来规划。
在技术流程上,传统模型数据应用流程正向大模型 ForRec 新流程演变,从大模型数据准备、推理,到语义化匹配检索、特征泛化及模型应用,未来将推动底层数据源以更低成本、更高效率和质量服务特征工程,通过算法挖掘让特征更及时、精准、泛化,同时借助产品化能力实现特征挖掘自动化、评估与实验结果自动化回流,赋能黑盒化算法模型和白盒化人群投放。


在推荐范式上,传统模型是 “猜你喜欢”,通过用户和物品特征关联提升点击率,聚焦高热用户和商品;大模型 ForRec 范式是 “懂你为什么喜欢”,通过深度刻画用户和物品突破传统信息闭环;生成式推荐(如 One Rank)则颠覆召回粗排精排链路,通过输入 instruction prompt 直接生成符合生态健康度等要求的 TOP 推荐商品,甚至可融入新品推广等策略,类似 ChatGPT 自动生成推荐结果,需突破时效性、QPS 和 RT 等技术保障。因此在生成式推荐的场景下,我们的数据特征基建需要往上下文信息丰富,以及时效性的视角再去做迭代和延展。


以上就是本次分享的内容,谢谢大家。


分享嘉宾
INTRODUCTION
钱英男
快手
商业化以及生活服务数据服务中心负责人
