推荐引擎中规则以及策略



转载请注明 AIQ - 最专业的机器学习大数据社区  http://www.6aiq.com

AIQ 机器学习大数据 知乎专栏 点击关注

转载自 杉枫 公众号
推荐系统是一个快速演进发展中系统,从最开始通过策略调整来提升点击率、UV 等指标,演进到通过算法来提升推荐效果,当下推荐系统更多关注于算法,通过算法优化迭代带来推荐效果提升,效果提升以后我们也应该关注效果是怎么带来提升的。

规则策略早些时候是我们推荐系统构建一个主要方式,通过策略可以使用一些规则来不断优化线上推荐效果,在策略时代主要通过不断优化策略来提升推荐效果。

推荐策略通过增加召回集将素材细分成更多分类,增加多个维度热门来提升数据,第一种方式本质是通过细分的分类来更好命中用户喜好,第二种是对热门补数进行扩展,希望通过扩展来拉新,让新用户产生兴趣。

推荐策略时代,加强过实时用户行为数据反馈强度,方式是将强用户实时品类偏好强度,对用户加购物车行为权重提升,来增加对用户实时行为进行及时反馈。

推荐策略还做过快速冷却算法,通过对素材进行梯度曝光,当曝光达到一定阈值点击率过低会不断减少曝光,相当于对不好素材进行冷却处理,对于点击率高素材在给予更多曝光,在看下一段时间曝光效果,从而形成马太效应,强者越强弱者越弱。

快速冷却更多要注意对于点击率计算,点击率会超过一这时就要甄别,可能是曝光素材曝光很少,但一个人点击了很多次从而点击率超过一,其实素材本身质量并不高,需要对这种情况进行解决,要对初次曝光数量设置合理阈值。

热门数据排序也是推荐策略调整很多一块,因为比如作为一个频道推荐,来频道用户很多不是系统热门用户很多是没有偏好的,并且这种用户还占有相当一部分比例,这时优化热门数据就很有必要了,因为这部门没有偏好用户主要通过热门数据来进行推荐。

热门数据能抓住用户,就对这部分用户进行了转化,抓不住就浪费了一次机会。

热门数据排序主要通过质量分模型来实现,通过一定公式,以及用户对素材反馈来计算出热门素材。热门素材定时进行更新这样可以将用户一段时间对素材交互情况反馈到热门中,将热门数据动起来,以及反应实际情况。

用户偏好,简单来说就是用户对于历史素材浏览、点击、查看来产生相应分类喜好强度。

新素材处理,比如文章推荐系统,会有 ugc 或者 pgc 不断纳入新素材,新素材引入会有一个比较大影响就是,新素材质量不行导致点击浏览整体大幅下滑,这时新数据引入就要特别注意技巧,要采用梯度式,不要一次引入,要慢慢引入并且根据反馈不断调整新素材权重。

推荐系统要注意对标题党、刷量、抄袭打击,因为从传播角度来说,坏消息、假消息是传播最快的,因为他与一般消息不一样,传播最为迅速,在有就是一些擦边文章也是深受用户喜爱。这时就需要做一些策略来进行打压,不然劣币驱逐良币最终导致无人创作有价值信息,标题党、吸引眼球党横行,最终失去用户。

我们路过高山

我们路过湖泊

我们路过森林

路过沙漠

路过人们的城堡和花园

路过幸福

我们路过痛苦

路过一个女人的温暖和眼泪

路过生命中漫无止境的寒冷和孤独

希望我们能一直向前,而不忘记初心


更多高质资源 尽在AIQ 机器学习大数据 知乎专栏 点击关注

转载请注明 AIQ - 最专业的机器学习大数据社区  http://www.6aiq.com