多模态对齐,寻找不同模态(如图像、文字、语音)中的属性的对应关系,文中主要是指多个VAE中的latent space的属性的对齐。 本文主要的工作贡献 训练了多个VAE从不同模态,如图像和类属性,中加密和解密特征,得到隐特征 通过对齐参数分布和减小跨模态重构损失来使隐特征多模态对齐 CADA-VAE证明了用于广义零镜头学习的交叉...