首先,长文本生成的任务可以定义为:给定输入,模型自动生成的过程,即。 基于以上的讨论,该工作基于 VQVAE 的方法提出 DiscoDVT(Discourse-aware Discrete Variational Transformer),首先引入一个离散code序列,学习文本中每个局部文本片段(span)的高层次结构,其中每一个从大小...