在训练代码里是感觉不到这些操作的,只会看到通过 DataLoader 就可以获取一个 batch 的数据,其实触发去读取图片这些操作的是 DataLoader 里的 __iter__(self) ,后面会详 细讲解读取过程。在本小节,主要讲 Dataset 子类。 因此,要让 PyTorch 能读取自己的数据集,只需要两步: 1. 制作图片数据的索引 2. 构建 Da...
定义自己的Dataset类实现灵活的数据读取,定义的类需要继承PyTorch自身的Dataset类。需要重写三个方法: ①:__init__: 用于向类中传入外部参数,同时定义样本集 ②:__getitem__: 用于逐个读取样本集合中的元素,可以进行一定的变换,并返回训练/验证所需要的数据 ③:__len__: 用于返回数据集的样本数 import torch fr...
技术分析 模型多样性 项目涵盖了各种现代卷积神经网络(CNN)和Transformer模型,每个模型都附带了详细的文档和配置选项,方便用户根据需求选择合适的模型。 预训练权重 所有模型都提供了在大规模数据集如 ImageNet 上预训练的权重,这使得用户能够立即在自己的数据上进行微调,而不需要从头开始训练,大大节省了计算资源和时间。