本文原作者:彭江军,经授权后发布。

导语:对于做算法的而言,了解一下整个流程是必要的。一来加深对整个环节的理解,二来:方便在定位badcase的知道可能是那块的问题所在。

1:写在前头,不专业的地方求轻喷

这部分做的时间比较短,大概半年的ES引擎维护工作,负责了两个小频道的召回服务(具体那两个不能说,万一之前遇到没有搜索出想看结果是因为我的召回服务的问题,那就不太好了。哈哈)。不过公司现在有专门的云服务来维护ES,另外不同的部分可能有自研的引擎,用法上不一样,但是作为排序的底层服务,在这里还是有必要提一下的。

2:工业流程

大体上分为召回和排序两个阶段。

解释说明一下:

1:当用户的请求过来后,搜索排序需要接受到这个信号,去调用引擎返回相关的doc,作为后续排序的基础。

2:对相关的doc 进行粗排,这里的粗排可以是引擎的相关分,也可以不是,这是一个初级的排序

3:对粗排的结果精排,包括加入更多维度的特征和一些复杂逻辑的处理

4:对于线上的情况,任何模型都不可能保证完全符合实际情况,干预因此是一个非常必要的模块。

3:整体流程的梳理

对于排序的模块在这里不做说明,下面简单的例举一下排序所依赖的上游服务。引擎模块已经数据聚合模块。图上描述的较为清晰了,具体的就不多讲了。

系列文章:

【技术分享】一:搜索排序—概述

https://cloud.tencent.com/developer/article/1523867

【技术分享】三:搜索排序—机器学习化建模

https://cloud.tencent.com/developer/article/1527336

【技术分享】四:搜索排序—数据的采集与构造

https://cloud.tencent.com/developer/article/1528253

【技术分享】五:搜索排序-特征分析

https://cloud.tencent.com/developer/article/1531448

【技术分析】六:搜索排序—指标介绍与选择

https://cloud.tencent.com/developer/article/1532635

【技术分享】七:搜索排序—排序模型

https://cloud.tencent.com/developer/article/1533656

腾讯云一站式机器学习平台智能钛TI-ONE试运营阶段限时0折,欢迎大家积极试用。

https://cloud.tencent.com/product/tio

更多优质技术文章请关注官方知乎机构号:

https://www.zhihu.com/org/teng-xun-zhi-neng-tai-ji-qi-xue-xi-ping-tai/activities

更多优质技术文章请关注官方微信公众号:

文章来源于腾讯云开发者社区,点击查看原文