transformer模型并不能直接识别我们输入的单词或者句子,首先在数据预处理阶段,会把每个单词进行embedding,然后加上位置编码,组成模型的输入部分。 除了输入,输出部分,我们进入transformer黑箱子模型部分,可以看到 transformer 模型有两个部分组成,一个编码器,一个解码器。