答:TF-IDF(Term Frequency-Inverse Document Frequency)算法用于计算词项的权重。计算过程如下: 1)计算词项在文档中的频率(TF,Term Frequency)。TF表示某个词项在文档中出现的次数,频率越高,TF值越大。 2)计算词项在整个语料库中的逆向文件频率(IDF,Inverse Document Frequency)。IDF表示词项在整个语料库中出现的频率...
为了消除频次带来的误差,引入权重,从而真正体现出词与词之前的关联度。tf-idf和PMI是两种常见的加权算法。共现矩阵真正衡量的是环境对目标词词义的贡献率(作用大小)。换句话说,词义就体现在环境对其的关联性上。 发布于 2021-07-10 14:46 赞同 分享收藏 写下你的评论... 还没有评论,发表第...