在TF-IDF中,词频随着增加而线性增长,可能导致高频词的影响过大。而BM25使用饱和度调整因子,使得高频词...
BM25在计算Query和Document之间的相似度时,本质上是依次计算Query中每个单词和Document的相关性,然后对每...