数据集与数据加载器

PyTorch 入门指南

学习基础知识

快速入门

张量

数据集与数据加载器

变换操作

构建神经网络

自动微分与 torch.autograd

优化模型参数

保存和加载模型

PyTorch 自定义操作符

学习 PyTorch

PyTorch 深度学习实战：60 分钟快速入门教程

通过示例学习 PyTorch

torch.nn 究竟是什么？

从零开始的自然语言处理

使用 TensorBoard 可视化模型、数据和训练过程。

关于在 PyTorch 中使用非阻塞和 pin_memory() 的良好实践指南

图像和视频

TorchVision 目标检测微调教程

计算机视觉中的迁移学习教程

对抗样本生成

DCGAN教程

空间变换网络教程

优化视觉变压器模型以进行部署

使用 PyTorch 和 TIAToolbox 进行全-slide 图像分类

音频

音频输入输出

音频重采样

音频数据增强

音频特征提取

音频特征增强

音频数据集

基于 Wav2Vec2 的语音识别技术

基于Tacotron2的文本转语音系统

使用 Wav2Vec2 进行强制对齐

后端

ONNX 入门

强化学习

强化学习（DQN）教程

强化学习（PPO）与 TorchRL 教程

训练一个玩马里奥的游戏代理，使用强化学习方法。

Pendulum：用TorchRL编写环境和转换

在生产环境中部署 PyTorch 模型

ONNX 入门

通过 Flask 框架使用 REST API 在 Python 中部署 PyTorch

TorchScript简介

在 C++ 中加载 TorchScript 模型

（可选）将 PyTorch 模型导出为 ONNX，并使用 ONNX Runtime 进行运行。

在 Raspberry Pi 4 上实现实时推理（30 帧/秒！）

Profiling PyTorch

_profiling您的PyTorch模块_

Holistic Trace 分析介绍

使用整体痕迹分析的痕迹差异追踪或者更自然一些：基于整体痕迹分析的痕迹差异追踪

代码变换与FX

（测试版）在FX中构建卷积和批量归一化的融合器

（测试版）使用FX 构建简单的CPU性能剖析工具

前端API

(beta) PyTorch 中的 Channels Last 内存格式

前向模式自动微分（ Beta 版）

雅可比矩阵、海森矩阵、HVP、VHP 等：组合函数变换

模型集成

per-样本梯度

使用 PyTorch 的 C++ 前端

TorchScript中的动态并行计算

C++ 前端的自动微分

扩展 PyTorch

PyTorch 自定义操作符

Python 自定义运算符

自定义 C++ 和 CUDA 操作符

双反向传播与自定义函数

使用自定义函数将卷积和批量归一化融合在一起

自定义 C++ 和 CUDA 扩展

使用自定义 C++ 操作符扩展 TorchScript

使用自定义 C++ 类扩展 TorchScript

在 C++ 中注册一个调度操作符

在 C++ 中扩展调度器以支持新的后端

通过PrivateUse1简化新后端集成

模型优化

_profiling您的PyTorch模块_

使用 TensorBoard 的 PyTorch 分析器

使用 Ray Tune 进行超参数调优

优化视觉变压器模型以进行部署

参数化教程

剪枝教程

（测试版）LSTM 单词语言模型的动态量化

（测试版）BERT的动态量化

（测试版）计算机视觉中的量化迁移学习教程

（测试版）PyTorch 中的静态量化（带 Eager 模式）

从基础知识出发，掌握 PyTorch 在英特尔 CPU 上的性能

从基础知识出发，掌握 PyTorch 在英特尔 CPU 上的性能（第二部分）

入门 - 使用 nvFuser 加速您的脚本

使用 Ax 进行多目标神经架构搜索

torch.compile 介绍

编译的自动微分：为 torch.compile 捕获更大范围的反向图

Inductor CPU 后端调试与性能分析

（测试版）使用缩放点积注意力（SDPA）实现高性能变压器

知识蒸馏教程

并行和分布式训练

分布式和并行训练教程

PyTorch 分布式概述

PyTorch 分布式数据并行 - 视频教程

单机模型并行的最佳实践

分布式数据并行入门

使用 PyTorch 编写分布式应用程序

开始使用全 shards 数据并行 (FSDP)

使用全数据并行（FSDP）进行高级模型训练

Libuv TCPStore 后端简介

使用张量并行（TP）进行大规模变压器模型训练

分布式管道并行简介

使用 C++ 扩展自定义进程组后端

分布式RPC框架入门

使用分布式远程过程调用框架实现参数服务器

使用异步执行来实现批处理 RPC 处理

结合分布式数据并行和分布式远程过程调用框架

使用 Join 上下文管理器进行输入不均匀的分布式训练

边缘端的 ExecuTorch

导出到 ExecuTorch 教程

在 C++ 中运行 ExecuTorch 模型教程

使用 ExecuTorch 开发者工具进行模型性能分析

构建 ExecuTorch iOS 演示应用

构建一个 ExecuTorch Android 演示应用

将模型降级为委托

推荐系统

TorchRec 入门

探索 TorchRec 分片功能

多模态

TorchMultimodal教程：微调FLAVA

学习基础知识 || 快速入门 || 张量 || 数据集和数据加载器 || 变换 || 构建模型 || 自动梯度 || 优化 || 保存和加载模型 数据集与数据加载器 处理数据样本的代码可能会变得混乱且难以维护；理想情况下，我们希望将数据集代码与模型训练代码解耦，以提高可读性和模块化。PyTorch 提供了两种数据原语：torch.utils.data.DataLoader 和 torch.utils.data.Dataset，允许您使用预加载的数据集以及您自己的数据。Dataset 存储样本及其对应的标签，而 DataLoader 则围绕 Dataset 封装了一个可迭代对象，以便轻松访问样本。 PyTorch 领域库提供了许多预加载的数据集（如 FashionMNIST），它们继承自 torch.utils.data.Dataset 并实现了特定于该数据的函数。这些数据集可用于模型的原型设计和基准测试。您可以在这里找到它们：图像数据集、文本数据集 和 音频数据集 加载数据集 以下是如何从 TorchVision 加载 Fashion-MNIST 数据集的示例。Fashion-MNIST 是 Zalando 的商品图像数据集，包含 60,000 个训练样本和 10,000 个测试样本。每个样本由一个 28×28 的灰度图像和一个来自 10 个类别之一的标签组成。 我们使用以下参数加载 FashionMNIST 数据集： root 是存储训练/测试数据的路径， train 指定是训练集还是测试集， download=True 表示如果数据在 root 路径下不可用，则从互联网下载数据。 transform 和 target_transform 分别指定特征和标签的转换方式。 importtorch fromtorch.utils.dataimport Dataset fromtorchvisionimport datasets fromtorchvision.transformsimport ToTensor importmatplotlib.pyplotasplt training_data = datasets.FashionMNIST( root="data", train=True, download=True, transform=ToTensor() ) test_data = datasets.FashionMNIST( root="data", train=False, download=True, transform=ToTensor() ) 0%| | 0.00/26.4M [00:00<?, ?B/s] 0%| | 65.5k/26.4M [00:00<01:13, 359kB/s] 1%| | 229k/26.4M [00:00<00:38, 674kB/s] 3%|3 | 918k/26.4M [00:00<00:10, 2.55MB/s] 7%|6 | 1.84M/26.4M [00:00<00:06, 3.81MB/s] 25%|##4 | 6.49M/26.4M [00:00<00:01, 14.8MB/s] 37%|###7 | 9.90M/26.4M [00:00<00:00, 17.0MB/s] 54%|#####4 | 14.3M/26.4M [00:01<00:00, 23.6MB/s] 68%|######8 | 18.0M/26.4M [00:01<00:00, 27.0MB/s] 83%|########3 | 22.0M/26.4M [00:01<00:00, 25.9MB/s] 100%|#########9| 26.4M/26.4M [00:01<00:00, 30.4MB/s] 100%|##########| 26.4M/26.4M [00:01<00:00, 19.1MB/s] 0%| | 0.00/29.5k [00:00<?, ?B/s] 100%|##########| 29.5k/29.5k [00:00<00:00, 328kB/s] 0%| | 0.00/4.42M [00:00<?, ?B/s] 1%|1 | 65.5k/4.42M [00:00<00:12, 360kB/s] 5%|5 | 229k/4.42M [00:00<00:06, 679kB/s] 21%|## | 918k/4.42M [00:00<00:01, 2.53MB/s] 44%|####3 | 1.93M/4.42M [00:00<00:00, 4.09MB/s] 100%|##########| 4.42M/4.42M [00:00<00:00, 6.05MB/s] 0%| | 0.00/5.15k [00:00<?, ?B/s] 100%|##########| 5.15k/5.15k [00:00<00:00, 32.8MB/s] 数据集迭代与可视化 我们可以像列表一样手动索引 Datasets：training_data[index]。我们使用 matplotlib 来可视化训练数据中的一些样本。 labels_map = { 0: "T-Shirt", 1: "Trouser", 2: "Pullover", 3: "Dress", 4: "Coat", 5: "Sandal", 6: "Shirt", 7: "Sneaker", 8: "Bag", 9: "Ankle Boot", } figure = plt.figure(figsize=(8, 8)) cols, rows = 3, 3 for i in range(1, cols * rows + 1): sample_idx = torch.randint(len(training_data), size=(1,)).item() img, label = training_data[sample_idx] figure.add_subplot(rows, cols, i) plt.title(labels_map[label]) plt.axis("off") plt.imshow(img.squeeze(), cmap="gray") plt.show() 为您的文件创建自定义数据集 一个自定义的 Dataset 类必须实现三个函数：__init__、__len__ 和 __getitem__。看一下这个实现；FashionMNIST 图像存储在目录 img_dir 中，它们的标签则单独存储在一个 CSV 文件 annotations_file 中。 在接下来的章节中，我们将逐一分解这些函数中的具体操作。 importos importpandasaspd fromtorchvision.ioimport read_image classCustomImageDataset(Dataset): def__init__(self, annotations_file, img_dir, transform=None, target_transform=None): self.img_labels = pd.read_csv(annotations_file) self.img_dir = img_dir self.transform = transform self.target_transform = target_transform def__len__(self): return len(self.img_labels) def__getitem__(self, idx): img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx, 0]) image = read_image(img_path) label = self.img_labels.iloc[idx, 1] if self.transform: image = self.transform(image) if self.target_transform: label = self.target_transform(label) return image, label __init__ __init__ 函数在实例化 Dataset 对象时运行一次。我们初始化包含图像的目录、标注文件以及两个变换（下一节将详细介绍）。 labels.csv 文件内容如下： tshirt1.jpg, 0 tshirt2.jpg, 0 ...... ankleboot999.jpg, 9 def__init__(self, annotations_file, img_dir, transform=None, target_transform=None): self.img_labels = pd.read_csv(annotations_file) self.img_dir = img_dir self.transform = transform self.target_transform = target_transform __len__ __len__ 函数返回数据集中样本的数量。 示例: def__len__(self): return len(self.img_labels) __getitem__ __getitem__ 函数加载并返回数据集中给定索引 idx 处的样本。根据索引，它识别图像在磁盘上的位置，使用 read_image 将其转换为张量，从 self.img_labels 中的 csv 数据中检索相应的标签，对它们调用转换函数（如果适用），并以元组的形式返回张量图像和相应的标签。 def__getitem__(self, idx): img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx, 0]) image = read_image(img_path) label = self.img_labels.iloc[idx, 1] if self.transform: image = self.transform(image) if self.target_transform: label = self.target_transform(label) return image, label 使用 DataLoaders 准备训练数据 Dataset 每次检索数据集的一个样本的特征和标签。在训练模型时，我们通常希望以“小批量”的方式传递样本，在每个 epoch 重新打乱数据以减少模型过拟合，并使用 Python 的 multiprocessing 来加速数据检索。 DataLoader 是一个迭代器，它通过简单的 API 为我们抽象了这些复杂性。 fromtorch.utils.dataimport DataLoader train_dataloader = DataLoader(training_data, batch_size=64, shuffle=True) test_dataloader = DataLoader(test_data, batch_size=64, shuffle=True) 遍历 DataLoader 我们已经将该数据集加载到 DataLoader 中，并可以根据需要遍历数据集。下面的每次迭代都会返回一批 train_features 和 train_labels（分别包含 batch_size=64 个特征和标签）。因为我们指定了 shuffle=True，所以在遍历所有批次后，数据会被打乱（如需更精细地控制数据加载顺序，请参阅 Samplers）。 # Display image and label. train_features, train_labels = next(iter(train_dataloader)) print(f"Feature batch shape: {train_features.size()}") print(f"Labels batch shape: {train_labels.size()}") img = train_features[0].squeeze() label = train_labels[0] plt.imshow(img, cmap="gray") plt.show() print(f"Label: {label}") Feature batch shape: torch.Size([64, 1, 28, 28]) Labels batch shape: torch.Size([64]) Label: 5 延伸阅读 torch.utils.data API 下载 Python 源代码: data_tutorial.py 下载 Jupyter 笔记本: data_tutorial.ipynb

本页目录

加载数据集

数据集迭代与可视化

为您的文件创建自定义数据集

`init`

`len`

`getitem`

使用 DataLoaders 准备训练数据

遍历 DataLoader

延伸阅读