那让我们来试试简单的版本,GRU (Gated Recurrent Unit),相当琐碎。 尤其是这一个,被称为 minimal GRU: 更多图解 LSTM 个多各样的变体如今很常见。下面就是一个,我们称之为深度双向 LSTM: DB-LSTM(参见论文:End-to-end Learning of Semantic Role Labeling Using Recurrent Neura