效果工具链之运营平台篇

来源: 贝壳智搜

在数据驱动、智能化浪潮中,工程和算法往往并行不悖。效果工具链贯穿了所有效果优化类业务,做到对优化流程的追踪、作业行为管控。作为效果优化系列的开篇文章,本篇旨在从工程角度介绍运营平台重塑作业流程的实施思路。除此篇之外,还包含算法迭代系统篇、搜索策略篇。

1.业务背景

随着业务规模现象级增长,围绕迭代效率为中心的敏捷实施过程可以明显缩减产品周期。在贝壳找房,为了满足用户多样的搜房体验、搜索等业务的快速发展,导致效果优化过程面临着高耦合的挑战。面对业务逻辑复杂、维护成本过高问题,只有科学的规划迭代流程,才能不断适应用户百变的口味。

这不仅给算法的迭代进度带来的挑战,也反推工程对工程架构的优化和研发,工程算法密切合作的同时也明确了工程、算法的边界。运营平台也以提供规范化流程应运而生。

2.平台理念

“我是谁?我从哪里来?要到哪里去?”看似简单的问题实际上包含了一整套思考解决问题的逻辑。一切问题的起点源于发现问题,才能进行后续一系列效果类优化。

2.1 我是谁-效果优化是什么?

效果优化即让数据驱动概念由隐性变得显性、且越来越显性的过程。无论哪种业务,更高的 CTR 或是商机转化,都需要经过发现问题、解决问题、模拟预测、线上实验环节,最终回归至问题本身。

2.2 从哪里来-问题根源?

首先,随着业务的逐渐成熟,优化路径变长、迭代缓慢的现象变得尤为普遍。为了减少迭代过程中的外界干扰,打通整套流程提高迭代效率变得尤为重要。

其次,业务积累伴随着参与优化的人数增加,面对的是业务代码的堆叠、逻辑的冲突、流程规范的缺失,针对每个问题一对一修改成本过高,所以需要一套完整的、灵活的标准流程来归纳、规范效果优化流程。

2.3 要到哪里去-结果导向?

针对上述问题,为了将标准贯穿效果优化周期的始终。一套以“提效、规范”为设计理念的灵活、高效的效果优化工具链应运而生。为了直观表达效果优化的各个环节,以下阐述的工具链仅为效果优化工具链流程的一个缩影。

效果优化闭环工具链缩影 效果评测系统:问题发现角度。通过评测日志等方式,发现搜索等效果优化类业务中的结果中的 badcase,归纳总结报表发现隐形问题。

人工干预系统:解决问题角度。通过人工干预方式,对评测过程中发现的 badcase 强行干预,保证业务结果的准确性。

离线预测系统:模拟预测角度。将发现问题针对算法、策略一系列优化后,离线方式模拟线上环境,预测线上效果、预估影响面。

AB 流量实验系统:线上实验角度。实验分流,通过多维度、多层次的对比实验观察线上效果,提升效果指标。

标注系统:回归至问题角度,辅助发现问题,丰富解决问题手段。

3. 技术架构

3.1 效果评测系统


  • 本文地址:效果工具链之运营平台篇
  • 本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出

评测流程图 作为效果优化过程的源头,为了满足各个业务效果评测效果的需求,对各个业务方离线日志中的召回、排序结果回放,还原原始请求等场景。

通过引入 NLU 解析信息以及离线用户画像偏好信息作为评测参考,将问题归类以便 PM 或 RD 在效果优化时及时发现问题所在。

3.2 预测系统

预测系统可以对将要上线的模型,策略规则,置顶房源等通过标准化,流程化的分析,做出准备的预测,以达到预测效果的作用。未来我们将更多的人力,打造预测系统,预测系统将对搜索效果优化,起到对新实验的影响面预测作用。对后续的模型上线,排序规则优化,提供预上线分析,降低直接上线带来的一系列风险。

3.3 人工干预系统

人工干预可对搜索的召回、粗排、精排、置顶、意图识别模块进行干预,以达到产品需求的快速响应,从而为产品优化预留出时间,以及对产品做优化。目前,人工干预已经成了正循环,对 C 端提出的需求进行快速干预。

在干预 case 同时,并不是就此结束,产品经理还会对 case 进行分类,在后续持续迭代优化中,具有指导性的建议。从而达到人工干预对整个搜索效果的赋能。

3.4 AB 流量实验系统

AB 实验 2000 年由 Google 工程师最早提出并应用至产品迭代。发展到现在,AB 实验早已在整个产品迭代周期中成为至关重要的一环,不断指导着产品迭代的同时也成为提升商机转化率的显式抓手。

作为数据驱动方法论的一面镜子,AB 实验通过数据来描述客观事实、用统计分析方法分析规律,为产品决策提供科学证据,提升用户体验。与经典的实验场景类似,我们设计的 AB 实验系统也基于流量大、样本多、完全独立、随机分流的特点,适配于搜索等效果优化类业务场景。宏观角度讲,我们的 AB 实验系统共有以下 4 部分组成。

  • 配置模块。RD 通过配置模块完成业务选择、配置策略上传功能,并下发至固定服务,做到固定服务实时生效配置策略。
  • 流量实验模块。选择服务,支持对实验层、实验分组及二者策略、流量的自定义配置、实验指标自定义配置。
  • 实验下发模块。实验配置实时下发至网关完成实验分流。业务方通过网关拉取实验策略信息。
  • 实验效果回收。支持实验效果 T-1 回收及存储。减轻实验分析、实验结果存储、实验效果对比成本。

AB 流量实验使用概览图 通过以上对比实验流程,即可完成实验组与对照组显著性差异分析。重塑 AB 实验时复杂的操作流程可能导致的线上风险。

3.5 标注系统

标注作为监督类学习中数据产出的唯一途径,一方面,往往因为标注规则千变万化导致标注成本突增。且数据质量提升不明显也成为算法性能提升的瓶颈。另一方面,将熟数据统一管理保证了数据安全,防止数据流失。系统架构图如下所示。

标注系统架构图

设计过程中,我们围绕“通用、提效、提质、管理“的原则、“自顶向下“的设计来思路设计,防止因为标注方式和规则的千变万化而过于定制,着重强调了任务的适配程度,做到文本、图片、语音类型数据的标注的高度适配及数据管理。除此之外,自定义标签提高了标注系统的灵活性,交叉验证保证数据质量。

4.总结展望

现阶段,运营平台经过了 0 到 1 的过程。下个阶段,平台对现有业务优化同时适配全量业务效果优化类任务流程。

优化目标:完全可视化、操作轻量化、流程规范化

优化理念:“提效降本、通用适配、规范管控”

针对以上目标与理念,做到算法工程并行迭代、互不影响。充分提效迭代优化流程。

5.作者简介

朱成浩,2019 年 6 月加入贝壳找房语言智能与搜索部应用架构组工作,负责标注系统建设等工作。

田朋,2018 年 5 月加入贝壳找房语言智能与搜索部应用架构组工作,主要负责特征工程、搜索策略相关工作。


本文地址:https://www.6aiq.com/article/1585214547994
本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出