expand (bool, optional) – True就是让扩大图片,让图片可以包括所有内容(图片旋转的话,四个角的信息其实是旋转到了图片的外面,这个是扩大图片的像素尺寸,如果True在后面还要接一个resize的transforms); 默认是False,旋转后的图片和输入图片是同样的尺寸。 center (2-tuple, optional) – 可以设置成非图片中心的旋...
本地网络(Localisation Network):本地网络为常规的CNN,是一个用来回归变换参数θ的网络。 网格生成器(Grid Genator):网格生成器在输入图像中生成与输出图像的每个像素相对应的坐标网络。 采样器(Sampler):采样器利用采样网络和输入的特征图同时作为输入,然后输入,得到了特征图经过变换之后的结果。 定义网络 class Net...
# pad mask的作用:在对value向量加权平均的时候,可以让pad对应的alpha_ij=0,这样注意力就不会考虑到pad向量 """这里的q,k表示的是两个序列(跟注意力机制的q,k没有关系),例如encoder_inputs (x1,x2,..xm)和encoder_inputs (x1,x2..xm) encoder和decoder都可能调用这个函数,所以seq_len视情况而定 seq...