论文标题:Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference 方法介绍 模型架构 Cobra 采用了经典的视觉编码器、连接两个模态的投影器和 LLM 语言主干组成的 VLM 结构。LLM 主干部分采用了 2.8B 参数预训练的...