这篇论文的算法结构是,两个编码器,一个负责文本,一个负责图像。两个解码器,分别是图文解码器和图图...
这里使用的适配器是CNN结构。因为CNN更能关注到视觉信息中的细节。工业异常检测若只用视觉编码器提取的特...