在搜索引擎中,rel等级得分,是由人工抽样数据,并且根据一定的规则打出来的等级得分。 步骤二: 计算IDCG(Ideal DCG),即完美序的DCG;计算方式也同步骤1,只是排序序列不是由算法得出,而是由人工对序列根据一定的评估准则排出来的最佳序列。 步骤三:根据前面2个步骤的出来的结果,计算NDCG,计算公式如下: n D C...
文本类的Embedding可以分为两种,一种是比较传统的word2vector、fasttext、glove这些算法的方案,叫做词向量固定表征类算法,这些算法主要是通过分析词的出现频率来进行Embedding生成,不考虑文本上下文。 而另一种文本Embedding方法,也是目前最流行的方案是动态词表征算法,比如Bert、ELMo、GPT,这类算法会考虑文本上下文。 问题...