看上去是可能work的,比较起作用的部分应该就是在encoder和decoder中间加了一个RFN结构,用它来控制输出的feature多少来自RGB,多少来自IR,融合的feature过decoder就可以得到融合之后的图像,核心观点就是在feature层面进行fusion,且fusion的力度可调,过了一个decoder也不会有太多artifacts。 感觉可以在RGB-IR的降噪任务中复现...