def forward(self, x: Tensor) -> Dict[str, Tensor]: : 函数参数中的冒号是参数的类型建议符,此处建议输入实参为Tensor类型。 -> 函数后面跟着的箭头是函数返回值的类型建议符,此处建议函数返回值类型为字典,键值类型分别str,Tensor。
与DEQ中使用两个隐式模型解方程计算输出和梯度不同,One-Step Gradient给出的“解耦合”策略是使用隐式模型计算输出,在获得输出以后,将隐式模型当做显式函数运行forward用于计算梯度——将隐式微分替换为显式函数,将会获得相当大的时间节约,同时相比于BPTT则...