与LSTM不同,GRU没有单独的记忆单元和输出门。这意味着GRU在处理序列数据时,信息流更加直接,计算也更加高效。然而,这并不意味着GRU的表现不如LSTM。在许多任务中,GRU的表现都能与LSTM相媲美,甚至优于LSTM。 结论LSTM和GRU是两种最常用的门控神经网络结构。它们通过引入额外的门和控制信息流的方式,有效地解决了传统...
由公式可见LSTM有4个权重矩阵,GRU只有3个,因此GRU的参数量是LSTM的¾。 LSTM参数量 Layer (type) Output Shape Param # === input_1 (InputLayer) (None, 28, 28) 0 ___lstm_1 (LSTM) (None, 100) 51600 ___