包含训练集和测试集的所有词。或者可以用更多词,用已经训练好的词向量进行初始化。
nn.Embedding(vocab_size, embedding_dim) 可以用在 连续变量吗 nn.Embedding层在 PyTorch 中主要用于将离散的整数索引映射到固定大小的向量,这在自然语言处理(NLP)任务中非常常见,因为它可以将离散的单词或符号转换为连续的向量,进而可以利用神经网络进行处理。这个层通常不直接用于连续变量,因为它期望的输入是离散的...
vocab_size指的是训练集的词典的大小。一般在训练集的词典中有一个词,假设记为blank。在测试的时候,...