what isseq2seq?seq2seq是RNN的变种,是一种N VS M的模型,这种结构又叫Encoder-Decoder模型,也可以称之为seq2seq模型。 直接上图(参考https://zhuanlan.zhihu.com/p/28054589) 如图所示,左边部分称为Encoder,生成c; 右边的部分称为Decoder,c通过Decoder得到输出y 也可以是另一种结构,如下 ...
但就我知道的来看,你用attention作为每一步的context的话,decoder的第一个hidden直接全0也完全ok ...