TransformerBlock模块: 包含自注意力层、归一化层、前馈神经网络(Feed Forward Network)以及Dropout层,形成了Transformer的主要构建块。 Encoder模块: 由多个TransformerBlock组成,负责对源序列进行编码。 Decoder模块: 同样由多个DecoderBlock构成,DecoderBlock中的自注意力机制允许解码器关注到目标序列自身的上下文信息,同时也...