对于推荐池不大的场景,粗排是非必选的。粗排整体架构如下: 二、粗排基本框架:样本、特征、模型 目前粗排一般模型化了,基本框架也是包括数据样本、特征工程、深度模型三部分。 (一)数据样本 目前粗排一般也都模型化了,其训练样本类似于精排,选取曝光点击为正样本,曝光未点击为负样本。但由于粗排一般面向上万的候选集...
1.1.2 粗排 粗排模块在推荐链路中,位于中间位置,前有召回模块,后有精排模块,它将召回模块筛选出的万量级的物品进行排序后,筛选出千或百量级的物品送入精排模块,发挥承上启下的作用,在精排前先做一次排序,控制进入精排模块的物品数量,减少精排模块在性能上的压力,从而给精排模型排序能力的提升释放空间。 粗排...
本节开始介绍搜索漏斗架构中的粗排阶段,粗排阶段的目标是从约上万级别的候选中筛选出合规、相关且成交效率高的topN商品,这里N通常是上千量级。而在粗排架构下,排序分可以简化为以下表达: f(x) = w_1 f_1(x) + …
1. 实时数据处理架构:推荐系统需实时处理数据,采用 Flink 或 Spark Streaming 等流式计算框架,能快速将用户实时行为数据(浏览、搜索、购买等)转化为粗排可用信息。 2. 基于用户行为序列的候选集调整:用户行为序列有丰富信息,如浏览运动鞋后浏览运动背包,可推测有购买运动装备需求,粗排时可增加相关候选。马尔可...
一、粗排、精排与重排算法原理 (一) 粗排算法原理 粗排是推荐系统中的第一道关卡,其主要目的是在海量的候选集中快速筛选出一批相对有潜力的候选项,以减少后续计算的压力。达观智能推荐在粗排阶段常采用基于规则或者简单模型的方法。例如,基于一些统计特征和简单的机器学习模型进行初步筛选。从统计特征角度来看,可以...
排序系统一般分为:召回和排序两个阶段。其中排序又分了粗排和精排。 召回 召回的目标是从千万级甚至亿级的候选中召回几千个,召回一般由多路组成,每一路会有不同侧重点(优化目标)。在推荐系统中,不同路代表了不同的优化目标。 排序 排序阶段就是把召回的结果进行排序,把topK(k一般都是个位数)结果作为推荐系统最...
一、粗排策略 召回的下一个环节就是粗排。粗排主要包括两类:基于规则、基于模型。 主要分以下三个步骤: 对召回的结果进行汇总去重 将去重后的结果输入粗排模型中 遴选出排名前几位的物料 1. 基于规则的粗排策略 如若召回策略都是基于规则或协同过滤的召回,那么每一路在返回时会有一个对应的归一化分数,先对所有召...
2.1 粗排的发展历史 在这里插入图片描述 粗排和精排有两点不同: 算力和RT的约束更严格:粗排的打分量远高于精排,同时有更严格的延迟约束,阿里巴巴定向广告的要求是10-20ms 解空间问题更严重:粗排和精排训练的时候使用的都是展现样本,但是线上打分环节粗排打分候选集更大,打分阶段距离展现环节更远,因此粗排阶段打分...
精排更注重商品的排序精度,因此以下粗排指标也类似 AUC:曝光空间下的AUC,有购买行为的商品作为正例。淘宝搜索一页请求会出10个商品,通常使用AUC@10来衡量,精排模型也使用该指标,因此可以借此评估粗排和精排的一致性程度;粗排hitrate@10:粗排越头部的商品能带来更多搜索场景内成交,说明粗排排序能力更强,与精...
粗排逐渐从单一维度的判断向多维度转变。曾几何时,行业内对粗排的重视程度还不高。而后,一些创新的模型架构被引入到粗排中。一段时间里,粗排主要应用于特定领域的小规模数据。 紧接着,大规模数据处理能力成为粗排发展的关键。过去,粗排的速度和精度难以平衡。渐渐地,深度学习技术为粗排带来了突破。有时期,粗排模型的...