TF-IDF 由两部分组成:TF(Term frequency,词频),IDF(Inverse document frequency,逆文档频率)两部分组成。IDF反映的是一个词能将当前文本与其它文本区分开的能力 TF: 其中分子 nij表示词 ii在文档 j 举个例子: 句子1:上帝/是/一个/女孩 句子2:桌子/上/有/一个/苹果 每个句子中词语的 TF : IDF: 其中|D|...