"作者：序玮闲鱼技术稿在互联网信息爆炸的今天，推荐系统是我们身边一个无法躲避的存在。在淘宝上浏览商品，在抖音上刷视频，以及无处不在的广告等等。本文探讨闲鱼商品推荐系统的同时，结合所面临的多推荐场景工程维护任务重、算法模型优化难以自动辐射多场景的痛点，介绍如何构建通用的推荐中台。背景推荐系统 ...."

Fork me on GitHub

AI架构
本助手集算力、智能于一身，为您提供最精彩全面的人工智能技术资讯
推荐系统 • 0 回帖 • 1.4K 浏览 • 1 年前

阿里技术｜详解闲鱼推荐系统（长文收藏）

作者：序玮闲鱼技术稿

在互联网信息爆炸的今天，推荐系统是我们身边一个无法躲避的存在。在淘宝上浏览商品，在抖音上刷视频，以及无处不在的广告等等。本文探讨闲鱼商品推荐系统的同时，结合所面临的多推荐场景工程维护任务重、算法模型优化难以自动辐射多场景的痛点，介绍如何构建通用的推荐中台。

背景

面临的问题

闲鱼目前推荐场景数10+，在过去四个月新增了4个新的场景（闲鱼币，新品推荐，购后推荐，新发tab），同时更多推荐场景正在规划中（省心卖，首页tab feeds流等），这么多的tpp场景背后是闲鱼对个性化推荐的大量需求。从工程角度来看每个新业务接入都需要从0到1搭建完整的推荐链路，除了大量重复的工作之外还伴随着不小的维护成本，如何才能降低如此众多场景的边际成本提升边际效益。从算法视角来看，这些推荐场的算法模型都需要case by case迭代优化，如何实现模型迭代优化自动辐射到更多的场景。

设计方案

设计目标

基于上文分析，如何在有限的成本之下快速从算法获取更多的红利是我们核心要解决的问题。因此我们期望构建这样一个推荐中台，通过一套推荐底坐支撑所有的中小推荐场，实现收敛推荐链路的同时让算法模型迭代形成规模效应。显然，针对不同的业务场景，其对推荐策略存在不同的诉求。即使同一个场景内，也存在不同策略实验的述求。因此我们将推荐链路中的各个环节，进行了抽象，沉淀出内容池策略、特征策略、召回策略、粗排&精排&重排策略等，每一个推荐场景便可以认为是各环节策略的组合。

同时，我们将策略以配置化+插件的方式对外输出。这样，当我们有新的场景接入时，不再需要去搭建完整的推荐链路，而是通过少量的配置化工作完成。最终将新场景上线的周期，由周级别降低至天级别，同时算法模型的迭代优化也能更加专注，接入流程如下图所示。

整体架构

如下图，是推荐中台的整体架构。整体上，我们依赖特征中心，根据用户与商品维度的特征信息灵活组合，计算产出各个场景的推荐候选池，并构建底池索引至引擎中。算法结合数据样本与底池，进行模型训练与召回数据训练，并产出模型与内容表，也回流至引擎供在线部分使用。在引擎部分，我们针对召回与排序，提供了通用召回与算分模型的同时，也定义了标准的输入输出协议，以满足业务场景定制化接入的诉求。场景的所有策略抽象，都收敛至实验平台进行管理。

用户在线请求pv到来后，我们首先根据场景id路由，拉取到相关配置后，根据具体的策略内容，逐步执行推荐各环节，如下示意。

召回引擎

召回策略上，我们提供了三种索引方式，分别是i2i索引，x2i索引，深度召回，并标准化掉召回的输入与输出。对于输入，有两种通用的格式，第一种为trigger格式，引擎将以传入的trigger作为key，从i2i与x2i索引中执行kv检索与倒排检索。第二种则是针对深度召回，上游传入模型预测出的embedding向量，再经由向量引擎完成检索。输出则是召回检索得到的商品item_id与对应的召回recall_score。目前三种方式共计10+路召回通道可供业务场景选择，每一路召回通道都枚举了一个标识。接入业务只需要配置选择用哪些召回通道即可。

• i2i：根据商品积累的用户点击行为，计算item-item的用户共现点击得分，作为i2i的相似度。

• x2i：这里的x可以是商品的tag、class、brand、query、pool_ids等，根据用户全域的行为构建用户偏好，对商品标题信息进行分词，以及用户的tag，class，品牌，搜索场景下对应query等，最终构建倒排索引进行检索。

• 深度召回：主要通过深度网络模型，来预测用户与商品的相似性。模型分别计算出用户侧向量与商品侧向量，在线检索时，根据用户侧向量，通过向量引擎完成ANN检索出topK个商品。

算分引擎

算分引擎的作用，是将输入的待打分候选商品集，关联上商品特征，并结合用户的特征，通过深度网络模型的计算执行，完成候选商品集中每一个商品对该用户的个性化预测得分。这里我们提供了一个包含ctr、cvr与互动的多目标算分模型，满足了大多数场景的个性化需求。此外，我们将算分排序模型的输入输出进行标准化，也提供了模型定制化的能力。有些场景不太适应通用的多目标模型，可遵循协议将模型接入，每一个模型具备一个唯一的标识biz_name，场景配置上选择该biz_name即可。

模型存在多个目标得分，比如ctr_score、cvr_score、car_score等。而最终的得分如何计算，场景内也支持配置运算表达式与加权&降权（有些场景倾向转化，有些场景则重成交，或者满足交易抵扣的商品需要提权），来满足不同的场景要求。

实验体系

推荐系统迭代极快，算法工程师通常会展开很多AB实验，需要能够灵活的支持实验策略与流量调整。此外，全量用户基本比较固定，用户在不同场景，以及场景内不同实验，均需要做到互不干扰，保证实验的独立性。在实现上，每次注册场景时，我们会同步创建实验与流量模型，并跟场景id进行绑定，确保场景之间的流量模型独立。场景内部多实验的诉求，则通过在流量模型内进一步动态分层的方式。这样场景A对应流量模型A，场景B对应流量模型B。而场景A里面，实验1按照50% vs 50%运行在流量模型A的分层1，实验2也可以按照50% vs 50%运行在流量模型A的分层2。

稳定性

推荐中台，承载了闲鱼10+推荐场流量，因此对系统的稳定性和业务的高可用有极高的要求。在系统部署上，分别在中心机房(张北)和单元机房(南通)进行了异地多机房部署，确保线上单一机房故障异常时，能够通过紧急切流将流量转发至正常机房提供服务。

此外，我们对接入的业务场景，也做了逻辑隔离。分场景配置限流熔断，当某一个场景有异常或者突发流量时，能够对其快速降级&熔断，避免其余场景受到影响，保障整体的高可用。

结语

推荐是一项系统性工程，近年来在计算架构、模型网络结构等方面也不断演进。本文在介绍闲鱼商品推荐架构的基础上，围绕如何在有限的成本之下快速从算法获取更多的红利这一核心问题，提出通用推荐中台解决方案。

推荐中台的搭建，是工程和算法将自身能力进行沉淀的一次有效尝试，新场景只需要天级别就能完成接入，工程与算法的维护迭代也将更为专注与聚焦。目前已经接入10+场景，对比场景接入前后的效率指标，其中点击转化率提升8%以上，人均ipv提升10%以上。同时随着接入场景增多，也为平台沉淀有价值的数据标签。

此外，当前整体链路上也仍存在一些不足。在排序模型上，模型的精度还有一些欠缺，以及多场景联合建模尚未开展。在工程上，场景接入还需要开发同学介入干预，自动化程度有待提升。后续我们将持续迭代优质工程与算法能力。

本文地址：https://www.6aiq.com/article/1665641013092
本文版权归作者和AIQ共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出

阿里技术｜详解闲鱼推荐系统（长文收藏）

背景

推荐系统

面临的问题

设计方案

设计目标

整体架构

推荐候选池

召回引擎

算分引擎

实验体系

稳定性

结语

相关帖子

随便看看

阿里技术｜详解闲鱼推荐系统（长文收藏）