LAION发布新的多模态数据 | LAION最新发布新的多模态数据集DataComp,共包含12.8B图像文本对,其中筛选后的数据集 DataComp-1B含有1.4B样本,可以作为LAION-2B的平替,使用 DataComp-1B训练的CLIP ViT-L模型在ImageNet上的性能能达到79.2,超过LAION-2B训练的模型(75.2)。 链接 ...
其中,Bunny-v1.0-3B 取得了全新SOTA,性能全面碾压多个7B 以下的模型,在多个基准上超越了 Imp、LLaVA-Phi、MobileVLM 等一系列模型,取得了与 LLaVA-v1.5-13B 等大模型相当的多模态理解和推理能力。Bunny-v1.0-2B-zh 在多模态中文基准上比肩LLaVA-v1.5-7B。