DSSM模型对于短文本搜索召回有很好的召回效果,但对于长文本以及在电商搜索中很多query词都带有型号的情况下,效果会比较差,比如输入“显卡RTX3090”,如果对输入按字处理,则会强制模型学习3、0、9、0四个数字是一种固定搭配,甚至有些电子产品的型号词数字加字母长达十几位,而真正的核心中文词也许只有短短几位,这就...
再把各个词的向量累加或者拼接起来,由于 Word2Vec 和 LDA 都是无监督的训练,这样会给整个模型引入误差,DSSM 采用统一的有监督训练,不需要在中间过程做无监督模型的映射,因此精准度会比较高。。
深度网络语义模型(DSSM) DSSM的结构如下图所示,这里采用的是DNN结构,将输入的query和document转换到低维的语义空间,然后计算他们的cosine相似度。 语义特征计算 语义特征计算部分,首先使用DNN网络将query和document从高维的空间转换到低维的空间。对输入的query和document假设他们是x,经过转换的向量为y,l_i表示隐藏层...
本文通过介绍DSSM、CNN-DSSM、LSTM-DSSM等深度学习模型在计算语义相似度上的应用 DSSM论文阅读与总结 基于深度网络的语义模型,其核心思想是将query和doc映射到到共同维度的语义空间中,通过最大化query和doc语义向量之间的余弦相似度,从而训练得到隐含语义模型,达到检索的目的。DSSM有很广泛的应用,比如:搜索引擎检索...
2. DSSM 深度语义匹配模型 DSSM [1](Deep Structured Semantic Models)的原理很简单,通过搜索引擎里 Query 和 Title 的海量的点击曝光日志,用 DNN 把 Query 和 Title 表达为低维语义向量,并通过 cosine 距离来计算两个语义向量的距离,最终训练出语义相似度模型。该模型既可以用来预测两个句子的语义相似度,又可...