一种基于文本和图像的多模态目标检测方法 近年来,网络上涌现了大量的多模态数据(图像,文本,视频,音频等),由于不同模态的数据之间具有互补性,因此,利用不同模态的数据进行分类,检测,分割等任务已成为计算机视觉... 员娇娇,胡永利,尹宝才 - 《中国传媒大学学报(自然科学版)》 被引量: 0发表: 2023年 小样本的多...