参考sampled softmax 模型中的 logQ 去偏,我们对每个logits进行了纠正,其中pjpj是每个item的估计采样概率(item j在一个随机batch内被采样到的概率)。 这里引入pjpj的作用是:降低热门商品的得分,提高冷门样本的得分。 训练用SGD: 关键的挑战是:item集合是动态的,item的频率也是动态的,因此本文最大的贡献是在一个...