PyTorch DataLoader shuffle

Question

I did an experiment and I did not get the result I was expecting. For the first part, I am using I save trainloader.dataset.targets to the variable a, and trainloader.dataset.data to the variable b before training my model. Then, I train the model using trainloader. After the training is finished, I save trainloader.dataset.targets to the variable c, and trainloader.dataset.data to

Accepted Answer

I believe that the data that is stored directly in the trainloader.dataset.data or .target will not be shuffled, the data is only shuffled when the DataLoader is called as a generator or as iteratorYou can check it by doing next(iter(trainloader)) a few times without shuffling and with shuffling and they should give different resultsimport torchimport torchvisiontransform = torchvision.transforms.Compose([        torchvision.transforms.ToTensor(),        ])MNIST_dataset = torchvision.datasets.MNIST('~/Desktop/intern/',download = True, train = False,                                           transform = transform)dataLoader = torch.utils.data.DataLoader(MNIST_dataset,                                         batch_size = 128,                                         shuffle = False,                                         num_workers = 10)target = dataLoader.dataset.targetsMNIST_dataset = torchvision.datasets.MNIST('~/Desktop/intern/',download = True, train = False,                                           transform = transform)dataLoader_shuffled= torch.utils.data.DataLoader(MNIST_dataset,                                         batch_size = 128,                                         shuffle = True,                                         num_workers = 10)target_shuffled = dataLoader_shuffled.dataset.targetsprint(target == target_shuffled)_, target = next(iter(dataLoader));_, target_shuffled = next(iter(dataLoader_shuffled))print(target == target_shuffled)This will give : tensor([True, True, True,  ..., True, True, True])tensor([False, False, False, False, False, False, False, False, False, False,        False, False, False, False, False, False, False, False, False, False,        False, False, False, False, False, False, False, False, False,  True,        False, False, False, False, False, False, False, False, False, False,        False, False, False, False, False, False, False, False, False, False,        False, False, False, False, False, False, False, False, False, False,        False, False, False, False,  True, False, False, False, False, False,        False,  True, False, False, False, False, False, False, False, False,        False, False, False, False, False, False, False, False, False, False,        False, False, False, False,  True,  True, False, False, False, False,        False, False, False, False, False, False, False, False, False, False,        False, False, False, False, False,  True, False, False,  True, False,        False, False, False, False, False, False, False, False])However the data and label stored in data and target is a fixed list and since you are trying to access it directly, they will not be shuffled.

Advertisement

Answer