最后一步是决定模型的输出,首先是通过sigmoid层来得到一个初始输出,然后使用tanh将 值缩放到-1到1间,再与sigmoid得到的输出逐对相乘,从而得到模型的输出。 这显然可以理解,首先sigmoid函数的输出是不考虑先前时刻学到的信息的输出,tanh函数是对先前学到信息的压缩处理,起到稳定数值的作用,两者的结合学习就是递归神经...