GRU是一种更简化的LSTM模型,它将输入门和遗忘门结合在一起,从而减少了参数数量。GRU的核心在于它的两个关键组件:更新门(update gate)和重置门(reset gate)。这两个门分别负责控制输入和重置隐藏状态。 3.2.1 更新门(update gate) 更新门用于决定将要保留的信息。它通过一个Sigmoid门和一个Tanh激活函数计算: $$...