•
pytorch tutorials中文文档
首页
/
PyTorch教程
PyTorch教程
PyTorch 入门指南
学习基础知识
快速入门
张量
数据集与数据加载器
变换操作
构建神经网络
自动微分与 torch.autograd
优化模型参数
保存和加载模型
PyTorch 自定义操作符
学习 PyTorch
PyTorch 深度学习实战:60 分钟快速入门教程
通过示例学习 PyTorch
torch.nn 究竟是什么?
从零开始的自然语言处理
使用 TensorBoard 可视化模型、数据和训练过程。
关于在 PyTorch 中使用非阻塞和 pin_memory() 的良好实践指南
图像和视频
TorchVision 目标检测微调教程
计算机视觉中的迁移学习教程
对抗样本生成
DCGAN教程
空间变换网络教程
优化视觉变压器模型以进行部署
使用 PyTorch 和 TIAToolbox 进行全-slide 图像分类
音频
音频输入输出
音频重采样
音频数据增强
音频特征提取
音频特征增强
音频数据集
基于 Wav2Vec2 的语音识别技术
基于Tacotron2的文本转语音系统
使用 Wav2Vec2 进行强制对齐
后端
ONNX 入门
强化学习
强化学习(DQN)教程
强化学习(PPO)与 TorchRL 教程
训练一个玩马里奥的游戏代理,使用强化学习方法。
Pendulum:用TorchRL编写环境和转换
在生产环境中部署 PyTorch 模型
ONNX 入门
通过 Flask 框架使用 REST API 在 Python 中部署 PyTorch
TorchScript简介
在 C++ 中加载 TorchScript 模型
(可选)将 PyTorch 模型导出为 ONNX,并使用 ONNX Runtime 进行运行。
在 Raspberry Pi 4 上实现实时推理(30 帧/秒!)
Profiling PyTorch
_profiling您的PyTorch模块_
Holistic Trace 分析介绍
使用整体痕迹分析的痕迹差异追踪 或者更自然一些: 基于整体痕迹分析的痕迹差异追踪
代码变换与FX
(测试版)在FX中构建卷积和批量归一化的融合器
(测试版)使用FX 构建简单的CPU性能剖析工具
前端API
(beta) PyTorch 中的 Channels Last 内存格式
前向模式自动微分( Beta 版)
雅可比矩阵、海森矩阵、HVP、VHP 等:组合函数变换
模型集成
per-样本梯度
使用 PyTorch 的 C++ 前端
TorchScript中的动态并行计算
C++ 前端的自动微分
扩展 PyTorch
PyTorch 自定义操作符
Python 自定义运算符
自定义 C++ 和 CUDA 操作符
双反向传播与自定义函数
使用自定义函数将卷积和批量归一化融合在一起
自定义 C++ 和 CUDA 扩展
使用自定义 C++ 操作符扩展 TorchScript
使用自定义 C++ 类扩展 TorchScript
在 C++ 中注册一个调度操作符
在 C++ 中扩展调度器以支持新的后端
通过PrivateUse1简化新后端集成
模型优化
_profiling您的PyTorch模块_
使用 TensorBoard 的 PyTorch 分析器
使用 Ray Tune 进行超参数调优
优化视觉变压器模型以进行部署
参数化教程
剪枝教程
(测试版)LSTM 单词语言模型的动态量化
(测试版)BERT的动态量化
(测试版)计算机视觉中的量化迁移学习教程
(测试版)PyTorch 中的静态量化(带 Eager 模式)
从基础知识出发,掌握 PyTorch 在英特尔 CPU 上的性能
从基础知识出发,掌握 PyTorch 在英特尔 CPU 上的性能(第二部分)
入门 - 使用 nvFuser 加速您的脚本
使用 Ax 进行多目标神经架构搜索
torch.compile 介绍
编译的自动微分:为 torch.compile 捕获更大范围的反向图
Inductor CPU 后端调试与性能分析
(测试版)使用缩放点积注意力(SDPA)实现高性能变压器
知识蒸馏教程
并行和分布式训练
分布式和并行训练教程
PyTorch 分布式概述
PyTorch 分布式数据并行 - 视频教程
单机模型并行的最佳实践
分布式数据并行入门
使用 PyTorch 编写分布式应用程序
开始使用全 shards 数据并行 (FSDP)
使用全数据并行(FSDP)进行高级模型训练
Libuv TCPStore 后端简介
使用张量并行(TP)进行大规模变压器模型训练
分布式管道并行简介
使用 C++ 扩展自定义进程组后端
分布式RPC框架入门
使用分布式远程过程调用框架实现参数服务器
使用异步执行来实现批处理 RPC 处理
结合分布式数据并行和分布式远程过程调用框架
使用 Join 上下文管理器进行输入不均匀的分布式训练
边缘端的 ExecuTorch
导出到 ExecuTorch 教程
在 C++ 中运行 ExecuTorch 模型教程
使用 ExecuTorch 开发者工具进行模型性能分析
构建 ExecuTorch iOS 演示应用
构建一个 ExecuTorch Android 演示应用
将模型降级为委托
推荐系统
TorchRec 入门
探索 TorchRec 分片功能
多模态
TorchMultimodal教程:微调FLAVA