对于推荐池不大的场景,粗排是非必选的。粗排整体架构如下: 二、粗排基本框架:样本、特征、模型 目前粗排一般模型化了,基本框架也是包括数据样本、特征工程、深度模型三部分。 (一)数据样本 目前粗排一般也都模型化了,其训练样本类似于精排,选取曝光点击为正样本,曝光未点击为负样本。但由于粗排一般面向上万的候选集...
一、粗排、精排与重排算法原理 (一) 粗排算法原理 粗排是推荐系统中的第一道关卡,其主要目的是在海量的候选集中快速筛选出一批相对有潜力的候选项,以减少后续计算的压力。达观智能推荐在粗排阶段常采用基于规则或者简单模型的方法。例如,基于一些统计特征和简单的机器学习模型进行初步筛选。从统计特征角度来看,可以...
召回环节还会承载业务及平台建设的使命比如用户和物品的冷启动、业务流量扶持等,召回环节的好坏直接决定了后续环节的上限。 粗排 接着是粗排,早期的推进系统中粗排常常用简单的融合策略进行,实践中发现粗排中引入算法是值得的。策略的组合较多测试周期长,双塔模型的应用既解决了多路召回组合的效率问题,又避免了精排的性能...
1.1.2 粗排 粗排模块在推荐链路中,位于中间位置,前有召回模块,后有精排模块,它将召回模块筛选出的万量级的物品进行排序后,筛选出千或百量级的物品送入精排模块,发挥承上启下的作用,在精排前先做一次排序,控制进入精排模块的物品数量,减少精排模块在性能上的压力,从而给精排模型排序能力的提升释放空间。 粗排...
粗排是为精排做准备的。 如果直接把多路召回的item扔进精排模型(比如是10000个item),那么可能会对精排的算力有一定的要求。 粗排是用来帮精排模型找到那些它本来就要打高分的item,只不过范围更广一些。 按照上面的例子,如果没有粗排,精排模型自己找出来的某top10的item。 而粗排的任务就是要找到包含这10个item的...
1. 实时数据处理架构:推荐系统需实时处理数据,采用 Flink 或 Spark Streaming 等流式计算框架,能快速将用户实时行为数据(浏览、搜索、购买等)转化为粗排可用信息。 2. 基于用户行为序列的候选集调整:用户行为序列有丰富信息,如浏览运动鞋后浏览运动背包,可推测有购买运动装备需求,粗排时可增加相关候选。马尔可...
一、粗排策略 召回的下一个环节就是粗排。粗排主要包括两类:基于规则、基于模型。 主要分以下三个步骤: 对召回的结果进行汇总去重 将去重后的结果输入粗排模型中 遴选出排名前几位的物料 1. 基于规则的粗排策略 如若召回策略都是基于规则或协同过滤的召回,那么每一路在返回时会有一个对应的归一化分数,先对所有召...
2.1 粗排的发展历史 粗排和精排有两点不同:算力和RT的约束更严格:粗排的打分量远高于精排,同时有更严格的延迟约束,阿里巴巴定向广告的要求是10-20ms解空间问题更严重:粗排和精排训练的时候使用的都是展现样本,但是线上打分环节粗排打分候选集更大,打分阶段距离展现环节更远,因此粗排阶段打分集合的分布和展现...
精排更注重商品的排序精度,因此以下粗排指标也类似 AUC:曝光空间下的AUC,有购买行为的商品作为正例。淘宝搜索一页请求会出10个商品,通常使用AUC@10来衡量,精排模型也使用该指标,因此可以借此评估粗排和精排的一致性程度;粗排hitrate@10:粗排越头部的商品能带来更多搜索场景内成交,说明粗排排序能力更强,与精...
作用:粗排是召回和精排之间的过渡阶段,它在保证召回率的同时,通过简单的模型或规则对候选物品进行初步排序,减少了后续精排的计算量。 精排(Fine-grained Ranking) 起源:精排的概念是在追求更高推荐准确性的过程中产生的。在粗排阶段过滤掉明显不符合用户兴趣的物品后,精排阶段会对剩余的候选物品进行精细的排序和打...