由公式可见LSTM有4个权重矩阵,GRU只有3个,因此GRU的参数量是LSTM的¾。 LSTM参数量 Layer (type) Output Shape Param # === input_1 (InputLayer) (None, 28, 28) 0 ___lstm_1 (LSTM) (None, 100) 51600 ___