Recognize Anything 模型 (RAM)和Tag2Text 模型的官方 PyTorch 实现。RAM 是一种强大的图像标注模型,可以高精度地识别任何常见类别。Tag2Text 是一种高效可控的视觉语言模型,具有标记指导。当与本地化模型 ( Grounded-SAM ) 结合使用时,Tag2Text 和 RAM 形成了强大而通用的视觉语义分析管道。 发布于 2023-06-10...