Pérez-Rúa J M, Vielzeuf V, Pateux S, et al. Mfas: Multimodal fusion architecture search[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019: 6966-6975. 18.2 内容 1.搜索框架 2.动机 在各自最深层特征处融合模态不一定是解决给定多模态问题的最佳方法。...
学习,要么是在不同领域搜索各自的网络结构,互补干涉。本文构建了一个通用的框架MMnas,囊括以上三大领域,自适应的搜索网络结构。 之前的多模态最好的方式,是基于BERT,MMnas相比于BERT不需要...本文在MFAS(MultimodalFusionArchitectureSearch)的基础上,构建了统一的encoder-decoder框架,并为每一个任务定制head预处理 ...