作者的方法在以零样本方式检测广泛范围的物体时表现出色,且效率高。 在具有挑战性的LVIS数据集上,YOLO-World在V100上实现了35.4 AP和52.0 FPS,在准确性和速度上都超过了许多最先进的方法。此外,经过微调的YOLO-World在包括目标检测和开集实例分割在内的几个下游任务上取得了显著性能。
YOLO-World 是下一代 YOLO 检测器,具有强大的开放词汇检测能力和定位能力。 YOLO-World 提出了一种先提示后检测的范式,用于高效的用户词汇推理,将词汇嵌入作为参数重新参数化到模型中,实现了更快的推理速度。您可以在我们的在线演示中尝试导出您自己的检测模型,无需额外训练或微调! 零样本评估预训练模型的结果: 以...
此外,微调后的 YOLO-World 在多个下游任务上取得了卓越的性能,包括对象检测和 open vocabulary实例分割。 图1.速度和精度曲线。我们将 YOLOWorld 与最近的开放词汇方法在速度和准确性方面进行了比较。所有模型都在 LVIS minival 上进行评估,推理速度在一个没有 TensorRT 的 NVIDIA V100 上测量。圆圈的大小表示模型的...
此外,经过微调的YOLO-World在包括目标检测和开集实例分割在内的几个下游任务上取得了显著性能。 集智书童公众号 2024/02/01 4.1K0 【论文复现】实时开放词汇目标检测 对象脚本论文模型编码 论文:YOLO-World: Real-Time Open-Vocabulary Object Detection Eternity._ 2024/11/30 5620 YOLO系列算法全家桶——YOLOv1-...
在具有挑战性的LVIS数据集上,YOLO-World在V100上实现了35.4 AP和52.0 FPS,在准确性和速度上都超过了许多最先进的方法。此外,经过微调的YOLO-World在包括目标检测和开集实例分割在内的几个下游任务上取得了显著性能。 1 Introduction 目标检测一直是计算机视觉中一个长期而基础性的挑战,在图像理解、机器人学和自动驾驶...
YOLO-World 是一种最先进的零样本目标检测模型。您可以向 YOLO-World 提供任意文本提示,让模型在没有任何微调的情况下识别图像中的对象实例。没有预定义的类别列表;您需要尝试不同的提示,看看模型是否能够以对您的项目可接受的标准来识别对象。 之前文中已经对其使用进行了详细介绍《YOLO-World检测一切的任务框架使用...
一、引子 CV做了这么多年,大多是在固定的数据集上训练,微调,测试。突然想起来一句话,I have a dream!就是能不能不用再固定训练集上捣腾,也就是所谓的开放词汇目标检测(OVD)。偶尔翻翻AI新闻,发现现在CV领域有在卷开集目标检测的趋势。刚好翻到,YOLO-World这一开源
它学习和适应的能力无需广泛的重新训练,使其成为从数据注释、家庭自动化到工业监控等各种应用的强大工具。虽然它有局限性,但其创新方法和未来发展的潜力使其成为值得探索的技术。YOLO-World可以用于边缘的零样本目标检测,也可以用于自动标记用于训练微调模型的图像。
YOLO-World 是一种最先进的零样本目标检测模型。您可以向 YOLO-World 提供任意文本提示,让模型在没有任何微调的情况下识别图像中的对象实例。没有预定义的类别列表;您需要尝试不同的提示,看看模型是否能够以对您的项目可接受的标准来识别对象。 之前文中已经对其使用进行了详细介绍《YOLO-World检测一切的任务框架使用...
表4. 在 COCO 上的可迁移性测试,测试了两种微调策略,线性探测和完全调整 这些结果充分证明,YOLOE 拥有强大的功能和高效率,适用于各种提示方式,可以实时看到任何东西。 此外,研究人员对 YOLOE 开展了四种场景的可视化分析: 图(a):在 LVIS 上进行零样本推理,以类别名称作为文本提示 ...