首先,open-vocabulary需要大规模的文本数据进行训练,这对于资源有限的情况下可能是一个问题。其次,open-vocabulary需要处理未知的词汇,这可能会导致一些歧义和错误。此外,open-vocabulary还需要解决词汇的演化和变化的问题,因为词汇是一个动态的概念,新的词汇不断涌现,旧的词汇也可能改变其含义。 总体来说,open-...
本文是聚焦于Open Vocabulary领域的第一篇综述。 1,为了明确定义,作者对Open Vocabulary和其他setting做了详细的区分和定义。具体来说,Open-Set/Open World/OOD 不对novel类别进行分类,Zero-Shot对novel类别进行分类,Open Vocabulary不仅对novel类别进行分类,它还可以使用和图像相关的文本数据进行弱监督训练,而Zero-Shot...
Open-vocabulary object detection refers to the task of detecting and localizing objects in images or videos without relying on a pre-defined set of object categories. In traditional object detection approaches, a fixed set of object categories is predefined, and the models are trained to classify ...