通过编码率正则化简化 DINO | DINO 和 DINOv2 是两个广泛用于从大规模无标注图像数据中学习表示的模型系列。它们学习到的表示通常能够为下游任务(例如图像分类和分割)带来最先进的性能。然而,它们采用了许多经验主义的设计选择,并且它们的训练流程非常复杂且不稳定——许多超参数需要仔细调整以确保表示不会崩溃——这对改进它们或将它们适应