GISer阿兴 遥感论文 | Arxiv | RS-CapRet:基于大模型的遥感图像标注和文本-图像检索方案,效果显著! GISer阿兴 遥感论文 | Arxiv | GeRSP:一种新颖的通用知识增强遥感预训练框架,用于场景分类、目标检测、语义分割等下游任务! GISer阿兴打开知乎App 在「我的页」右上角打开扫一扫 其他扫码方式:微信 下载知乎...
遥感论文 | Arxiv | LHRS-Bot:一个为遥感图像理解量身定制的大语言模型,代码和数据已开源! GISer阿兴 遥感论文 | Arxiv | SkyEyeGPT:专为RS视觉语言理解而设计的统一的多模态大型语言模型,在遥感任务中效果显著! GISer阿兴 遥感论文 | Arxiv | RS-Mamba:用于高分辨率遥感影像分割和变化检测任务的新Mamba模...
论文题目:SegEarth-OV: Towards Traning-Free Open-Vocabulary Segmentation for Remote Sensing Images论文链接:https://arxiv.org/pdf/2410.01768论文代码:https://likyoo.github.io/SegEarth-OV/发表时间:2…
论文题目:Zooming Out on Zooming In: Advancing Super-Resolution for Remote Sensing论文链接:https://arxiv.org/pdf/2311.18082.pdf论文代码:https://github.com/allenai/satlas-super-resolution/tree/main…
论文链接:https://arxiv.org/pdf/2401.12665.pdf 发表时间:2024.1.23 论文代码:https://github.com/Lszcoding/ClipSAM 摘要 最近,诸如CLIP和SAM等基础模型在零样本异常分割(ZSAS)任务中表现出有希望的性能。然而,无论是基于CLIP还是SAM的ZSAS方法仍然存在一些不可忽视的缺点: ...
遥感论文 | Arxiv | 将不同遥感图像模态与CLIP视觉和文本模态对齐的方法,在图像分类和跨模态检索任务上效果显著! GISer阿兴 遥感论文 | Arxiv | SpectralGPT:多光谱遥感大模型来了! GISer阿兴 遥感论文 | Arxiv | SkyEyeGPT:专为RS视觉语言理解而设计的统一的多模态大型语言模型,在遥感任务中效果显著! GIS...
1. CLIP论⽂地址: https://arxiv.org/abs/2103.00020模型:对比学习,预测N*N对图文数据,将图片分类任务转换成图文匹配任务: ⽂本编码器( CBOW or Text Transform) 采⽤ Transformer 经典结构(源⾃ Atten-ti…
https://arxiv.org/abs/2407.14117 文章总结 最近的研究表明可以通过促进知识有效转移来提高对比视觉语言预训练(CLIP)的low-shot能力。然而,对原有模型的调整方法通常是在输入图像的全局视图上操作的,因此对图像的部分局部细节的感知是有偏差的。为了解决这个问题,我们提出了在测试阶段的适应计算之前进行视觉内容细化(VC...
https://arxiv.org/abs/2312.03818 关键词:在CLIP输入中引入新通道 文章总结 对比语言-图像预训练 (CLIP) 在从不同任务的图像中提取有价值的内容信息方面发挥着至关重要的作用。它对齐文本和视觉模式来理解整个图像,包括所有细节,甚至是那些与特定任务无关的细节。然而,为了更精细地理解和控制图像的编辑,关注特定的...
https://arxiv.org/abs/2103.00020 2. CLIP模型简介 CLIP的基本算法原理如下,为了对image和text建立联系,首先分别对image和text进行特征提取,image特征提取的backbone可以是resnet系列模型也可以是VIT系列模型,text特征提取目前一般采用bert模型,特征提取之后,由于做了normalize,直接相乘来计算余弦距离,同一pair对...