"[图片] 作者简介冯丙见一下科技大数据部门资深架构师 [图片] 一直播现在大家都能看到它的影子，技术上面来讲很多东西都是通用的，可以在这里面借鉴一下，看看是不是有一些在你工作当中可以适用的东西。从三个方面介绍一下我们的系统，一个是面向我们架构设计，一个是用户画像系统，还有一个是评估推荐系统。 ...."

Fork me on GitHub

dubianma
AIQ 10020 号成员
推荐系统算法 • 0 回帖 • 2.9K 浏览 • 4 年前

一直播千万量级用户推荐系统设计之路

作者简介

冯丙见

一下科技大数据部门资深架构师

一直播现在大家都能看到它的影子，技术上面来讲很多东西都是通用的，可以在这里面借鉴一下，看看是不是有一些在你工作当中可以适用的东西。

从三个方面介绍一下我们的系统，一个是面向我们架构设计，一个是用户画像系统，还有一个是评估推荐系统。

1、推荐系统架构设计

我们先来看一下推荐系统产生的背景，随着互联网技术发展，信息过载成为普遍问题，信息消费者，从海量信息中找到自己感兴趣的内容比较困难，作为信息生产者，让自己生产的信息脱颖而出，受到广大用户的关注也是比较困难的。

这个问题很早之前就已经意识到了，并且有了解决方案。最早的解决方案是以雅虎，后来推出了搜索引擎，因为搜索引擎找到相关的内容给用户，如果用户描述的关键字不准确，或者用户本身没有什么需求，这个时候推荐系统不需要用户描述它的需求，是根据它的历史给用户推荐感兴趣的内容，推荐系统是用来满足用户需求不是很明确的时候，帮用户找到可能感兴趣的内容。

推荐系统的主要任务就是建立用户和信息之间的联系，一方面帮用户找到他可能感兴趣的内容，同时另一方面把信息呈现在可能对它感兴趣的用户面前，以此达到双方共赢。

解决海量信息过载时用户获取信息效率，解决用户无明确需求时信息获取，长尾物品推荐，满足小众个性化需求，我们现在常见的是个性化推荐，已经成为了各大网站的标配了。

再一个app上面的话是中间件存在，一个内容的话，是推荐系统根据模型推荐你内容，同时做一些相关性的推荐，比如说“看了又看，买了又买”相关性的推荐。或者你买了一个东西，给你推荐和这个东西最相关的，在一些社交网站会推荐一些相似用户或者好友相似推荐。我们会预测到用户感兴趣的话，会给推一些感兴趣的信息。

我们看一下整体流程，过滤出优质内容，去除低速、敏感信息。我们根据用户的兴趣找到他感兴趣的内容，用常用的一些算法找到感兴趣的内容，比如说看了一个美食的视频，就可以把新的视频推荐给你。

如果发现你跟某一个人很相似，那个人看过我的视频，你没看过，就可以把这个推荐给你，在这个量级，一个用户很难说一天一次把这些多文章和视频看完，所以我们进行三步走，就是把用户最感兴趣的内容放在最前面，根据用户、物品特征，含量信息预估视频的可能性，根据这个可能性从高到低的排序，把最可能看的推荐给他，经过这一步之后剩下的可能是几十个或者几个了，这个量级用户一次是有可能看完的。