这就将next_word预测了出来,后面的流程就是将“hello”加到“say”后面变成“say hello”,迭代上述流程直到生成eos_token(终止词),整个预测也就完成了,这就是整个自回归的过程。上述就是不加任何参数和后处理的生成式模型的generate/inference全过程,这个过程也叫做greedy decoding贪心解码策略,下文会介绍。 常见参数...