作者:Zhiyin Shao, Xinyu Zhang, Meng Fang, Zhifeng Lin, Jian Wang, Changxing Ding 摘要:文本到图像的行人重识别(ReID)旨在通过文本描述来搜索感兴趣的身份的行人图像。由于丰富的模态内变化和明显的模态间差距,它具有挑战性。现有的工作通常忽略了两种模态之间特征粒度的差异,即视觉特征通常是细粒度的,而文本特...
之前经常总结时间序列paper list的汇总,这次弄了些不一样的,总结了ACM MM 2022关于情感计算的论文汇总(主要侧重于情感计算中关于情绪识别的论文),进行情绪识别可以使用图像,视频,语音,生理信号等多种数据,不过我感觉MM作为多媒体的顶会,还得是使用多模态进行情绪识别可能更符合MM。 1. 论文标题:Leveraging Multi-mod...
图 1 水印嵌入检出架构图 2.1 区域选择策略 图像内容主要集中在低频区域,细节集中在高频区域。在视频编码过程中,高频系数容易被量化,水印嵌在高频区域容易被抹除;而水印嵌入在低频系数中又对画质会产生可感知影响。根据以上分析,本文基于纹理信息和 ORB 特征点来选择适合嵌水印的区域,不仅减少对画质的影响,而且...
在构建基准的过程中,本文遵循了经典的小样本检测数据集 Pascal VOC 的设置(类别总数为 20,其中 15 类为基类,5 类为新类),从现有公开的数据集中选择了 14 个类别,其中 5 个类来自 OPIXray 数据集(ACM MM2020),5 个类来自 HiXray 数据集(ICCV 2021),剩余 4 个类来自 EDS 数据集(CVPR 2022...
美图公司联合北京航空航天大学、中国人民大学、在 ACM MM 2022 上举办第四届 Person in Context (PIC)竞赛。PIC 竞赛关注以人为中心的视频内容理解,本届比赛一共包括三个赛道,涵盖视频内容时序定位、视频描述生成,视频内容时空定位等跨模态任务。这些任务需要机器理解视频中人的动作、行为、交互,并能关联视觉和文本内容...
Language Sequences》的学术论文被国际多媒体会议ACM MM 2022(ACM International Conference on Multimedia)录用;一篇题为《CA-SpaceNet: Counterfactual Analysis for 6D Pose Estimation in Space》的学术论文被国际智能机器人与系统会议IROS...
ACM MM2022|基于多尺度 Transformer 的视频插帧方法 论文标题:Multi-Scale Coarse-to-Fine Transformer for Frame Interpolation发表会议:ACM MM2022作者:Chen Li,Li Song,Xueyi Zou,Jiaming Guo,Youliang Yan,Wenjun Zhang论文链接:https://dl.acm.org/doi/abs/10.1145/3503161.3548011 本文介绍我们最新发表在 ACM ...
ACM Multimedia 2022 calls for research papers presenting novel theoretical and algorithmic solutions to address problems across multimedia and related application fields. The conference also calls for papers presenting novel, thought-provoking ideas and promising (preliminary) results in realizing these ideas...
本文介绍一篇ACM MM 2022 Oral的工作。基于传统的跨模态文本-视频检索(Video-to-Text Retrieval, T2VR)任务,该工作提出了一个全新的文本到视频跨模态检索子任务,即部分相关的视频检索(Partially Relevant Video Retrieval, PRVR)。 PRVR任务旨在从大量未剪辑的长视频中检索出与查询文本部分相关的对应视频。若一个未...
论文Content and Gradient Model-driven Deep Network for Single Image Reflection Removal发表在多媒体顶级会议ACM MM 2022上,由深圳大学计算机与软件学院计算机视觉所完成。 该工作针对单图像反射移除任务提出了一个内容和梯度引导的深度展开网络。该方法结合了模型驱动和数据驱动的优点,不仅能够保持较好的反射移除性能,而...