搜索系统的训练数据如何自动标注或利用线上数据标注?

搜索系统的训练数据标注。除了人工标注的方法,还有什么好的例子可以借鉴?

比如利用线上数据自动标注?

目前 的做法是, 根据 query 词人工标注一些合理的结果,并进行有差异的打分。
能否通过用户的实际行为数据,进行打分,然后训练? 目前来看,这样做可能无法达到一个比较好的状态。因为用户的行为数据是基于目前模型产生的结果中的一个。并且,很可能用户点击的商品或下单的商品跟 query 词的关系不是很大。

想了解一下,有没有根据线上数据自动产生训练集的做法。


更多高质资源 尽在AIQ 机器学习大数据 知乎专栏 点击关注

转载请注明 AIQ - 最专业的机器学习大数据社区  http://www.6aiq.com