各个机构陆续发布过多模态数据集及图像数据集,但是由于数量不多或并未公开,并不能在多模态预训练模型上取得较好的效果,这里将LAION和以前的部分数据集进行了简单对比。 1.1 图文对数据集 最开始,数据集均通过人工注释生成,如COCO[7]和Visual Genome[8],COCO Captions在COCO图片数据基础上,由人工标注图片描述得到。...
当然,我们也可以使用训练好的模型在coco 1k数据集上生成图片。 然后可以`generate_images.py`文件生成对应的图片。 ```bash python generate_images.py \ --model_name_or_path ./ldm_pipelines \ --file coco1k \ --batch_size 16 \ --save_path ./outputs \ --guidance_scales 3 \ --seed 42 \ ...
当然,我们也可以使用训练好的模型在coco 1k数据集上生成图片。 然后可以`generate_images.py`文件生成对应的图片。 ```bash python generate_images.py \ --model_name_or_path ./ldm_pipelines \ --file coco1k \ --batch_size 16 \ --save_path ./outputs \ --guidance_scales 3 \ --seed 42 \ ...