pipeline_model_parallel_size(必选,默认为1):表示一个pipeline模型并行通信组中的GPU卡数,pipeline并行相当于把layer纵向切为了N个stage阶段,每个阶段对应一个卡,所以这里也就等于stage阶段数。例如 pipeline_model parallel_size 为2,tensor_model parallel_size 为4,表示一个模型会被纵向分为2个stage进行pipeline并行...