本发明公开了一种多模态多拼接的RGB‑D显著性目标检测方法。本发明采用ResNet50对RGB图像和经过处理的三通道深度图像进行预训练,并且从预训练中提取特征信息相互交叉结合,这是在现有方法中基本没有运用过的;在后期设计的模型中又运用到ResNet模块训练,使得训练信息前后相匹配;模型中还设计了一个采用卷积与Denseblock...
图2(a)描述了所提出的方法的整体框架,它由一个跨模态引导编码器和一个分割解码器组成,给定RGB-D数据作为输入,编码器通过SA-Gate单元对两种模态的互补信息进行重新校准和融合,然后通过双向多步传播(BMP)模块将融合后的多模态特征和特定模态特征一起传播...
内容提示: 计算机辅助设计与图形学学报 Journal of Computer-Aided Design & Computer Graphics ISSN 1003-9775,CN 11-2925/TP 《计算机辅助设计与图形学学报》网络首发论文 题目: 基于多模态自适应卷积的 RGB-D 图像语义分割 作者: 孙启超,恩擎,段立娟,乔元华 收稿日期: 2021-06-04 网络首发日期: 2022-07-14 ...
使用五种常用指标进行了实验,结果表明,所设计的框架具有良好的鲁棒性和泛化性。同时,JLDCF在七个具有挑战性的数据集上显著提高了SOTA模型的平均2.0% (F-measure)。此外,我们表明,JL-DCF很容易适用于其他相关的多模态检测任务,包括RGB-T(热红外)SOD和视频SOD (VSOD),性能SOTA。这进一步证实了所提出的框架可以为...
因此,研究设计一种有效融合多模态数据的混合特征,对于提升真实复杂场景中的扫描片段的注册精度和整体建模鲁棒性具有重要作用。 本文工作 本文提出了一种新颖的鲁棒场景三维扫描注册算法,通过对RGB-D多模态数据进行学习,并利用多视角图像信息来补充三维几何特征,显著地提升了三维场景扫描片段的注册性能。通过提取二维图像...
RGB-D多模态人脸识别方法研究.PDF,摘要 人脸识别是一个历史悠久的研究课题。随着机器学习,尤其是深度学习的发展,以 及大数据的爆炸式增长,二维图像人脸识别技术近几年获得了长足的进步。然而,由于 二维图像对姿态、光照、表情等因素的敏感性,在较为恶劣的条件,诸如巨
原则上,特征建模方案是在对深度敏感的注意力模块中执行的,这可以通过预先捕获深度几何来提高RGB特征并减少背景干扰。 此外,为了执行有效的多模态特征融合,作者还提出了一种针对RGB-D SOD的自动体系结构搜索方法,该方法能很好地从作者专门设计的多模态多尺度搜索空间中找到了可行的体系结构。 本文在七个标准基准上进行...
本发明属于计算机视觉领域,具体涉及一种基于多模态特征融合的RGB‑D图像语义分割方法。由于RGB和深度特征的内在差异,如何更有效地融合两种特征仍是有待解决的问题。为了解决该问题提出了注意力引导多模态交叉融合分割网络(ACFNet),本发明采用编码器-解码器结构,将深度图编码为HHA图像,设计非对称双流特征提取网络,RGB和...
一种多模态对齐校准的RGB-D图像显著目标检测方法专利信息由爱企查专利频道提供,一种多模态对齐校准的RGB-D图像显著目标检测方法说明:本发明公开了一种多模态对齐校准的RGB‑D图像显著目标检测方法,包括以下步骤从RGB‑D图像中...专利查询请上爱企查
基于RGB-D多模态数据的双向人流量统计方法专利信息由爱企查专利频道提供,基于RGB-D多模态数据的双向人流量统计方法说明:本发明公开了基于RGB‑D多模态数据的双向人流量统计方法,属于计算技术觉领域。主要包括RGB‑...专利查询请上爱企查