而one-hot是一个词本身是一个向量(一维是1,其他是0),不同词之间的区别是1的位置不同,但是1的位置不表示实际意义 而word2vec中,每个词用一个实数向量表示,语义相近的词的向量夹角余弦相似度更相近 比如 都是水果等等 one-hot和word2vec 都属于 distributed represent 表示法 word2vec可能需要涉及到一些聚类等,...
一般来讲,将字符表示为向量,有两种表示方式:one-hot vector和Distributed representation 1.one-hot vector 在以往的处理中,最为直观的做法就是One-hot Representation,做过数据挖掘方面的同学肯定对此不陌生,它就是将一个词映射为一个一维的向量,只有一个元素为1,其余全部为0,并且其他词的向量不能和它相同。如下...