近日,腾讯优图实验室11篇论文被国际人工智能多媒体领域顶级会议ACM MM 2022(ACM International Conference on Multimedia)所接收,涵盖盲超分辨率算法、视频场景分割分类等多个研究方向,这些技术创新面向智慧文娱、智慧媒体、智慧旅游等场景的落地应用,助力进一步提升AI技术能力,推进全球人工智能的发展。作为世界多媒体领域重要...
图 1 水印嵌入检出架构图 2.1 区域选择策略 图像内容主要集中在低频区域,细节集中在高频区域。在视频编码过程中,高频系数容易被量化,水印嵌在高频区域容易被抹除;而水印嵌入在低频系数中又对画质会产生可感知影响。根据以上分析,本文基于纹理信息和 ORB 特征点来选择适合嵌水印的区域,不仅减少对画质的影响,而且...
一、技术概览 MegaPortraits 提出了一种基于神经网络的头像生成技术,专注于通过单一肖像图像生成高分辨率(百万像素级别)的虚拟头像。与现有的方法不同,该技术尤其适用于 跨域驱动(cross-driving)场景,即动…
2022年7月1日,美图影像研究院(MT Lab)联合北京航天航空大学、中国人民大学在ACM国际多媒体会议(ACMInternational Conference on Multimedia,ACMMM)上主办的第四届Person in Context(PIC)竞赛圆满收官。此次PIC竞赛因其前沿性和实用性吸引了来自清华大学、北京大学、上海交通大学、香港大学、中国科学技术大学等国内知名高校...
导读 论文Content and Gradient Model-driven Deep Network for Single Image Reflection Removal发表在多媒体顶级会议ACM MM 2022上,由深圳大学计算机与软件学院计算机视觉所完成。该工作针对单图像反射移除任务提出了一个内容和梯度引导的深度展开网络。该方法结合了模型驱动和数据驱动的优点,不仅能够保持较好的反射移除...
虽然目前传统的跨模态检索工作已取得了巨大的进展,但由于缺少低资源语言的标注数据,这些工作通常关注于高资源语言(比如英语),因此极大地限制了低资源语言在该领域的发展。为了解决这一问题,作者针对跨语言跨模态检索任务(CCR)展开了研究,该任务旨在仅使用人工标注的视觉-源语言(如英语)语料库对模型进行训练,使其可以适...
ACM Multimedia 2022 calls for research papers presenting novel theoretical and algorithmic solutions to address problems across multimedia and related application fields. The conference also calls for papers presenting novel, thought-provoking ideas and promising (pr...
ACM Multimedia 2022 calls for research papers presenting novel theoretical and algorithmic solutions to address problems across multimedia and related application fields. The conference also calls for papers presenting novel, thought-provoking ideas and promising (preliminary) results in realizing these ideas...
编者按:近期,顶级多媒体会议(ACM MM)公布了2473篇有效投稿中的录取结果,最终录取了690篇论文,录取率约为27.9%。中国科学院信息工程研究所第三研究室有多篇论文入选,以下是几篇详细解析:1. 基于摄像头的有用数据增强模块:不平衡行人再识别 作者:洪娉婷、吴大衍(通讯作者)、李波、王伟平 ...
近日,计算机多媒体顶级会议ACM Multimedia 2022接收论文结果已经正式公布,会议接收了一篇由北京航空航天大学、科大讯飞研究院共同完成的工作。这项工作以X光安检场景为例,针对一些危险品类别出现频率较低导致样本难以获取的现实情况,构建了X-ray FSOD数据集,为X光下小样本检测任务提供模型检测能力评估基准。