•
pytorch tutorials中文文档
首页
/
pytorch音频
/
torchaudio.prototype.datasets
Torch audio 文档
索引
支持的功能
功能分类
TorchAudio 徽标
参考文献
安装
安装预编译的二进制文件
从源码构建
在 Linux 和 macOS 上构建
在 Windows 上构建
在 Jetson 上构建
启用 GPU 视频解码器/编码器
API 教程
音频输入/输出
StreamReader 基本用法
StreamReader 高级用法
StreamWriter 基本用法
StreamWriter 高级用法
使用 NVDEC 加速视频解码
使用 NVENC 加速视频编码
AudioEffector 使用指南
音频重采样
音频数据增强
音频特征提取
音频特征增强
CTC 强制对齐 API 教程
振荡器和ADSR包络
加法合成
滤波器设计教程
减法合成
音频数据集
管道教程
使用 Wav2Vec2 进行语音识别
使用 CTC 解码器进行语音识别推理
使用 CUDA CTC 解码器进行 ASR 推理
使用 Emformer RNN-T 进行在线语音识别
使用 Emformer RNN-T 进行设备端语音识别
设备端基于 Emformer RNN-T 的音频-视觉语音识别
使用 Wav2Vec2 进行强制对齐
多语言数据的强制对齐
使用 Tacotron2 实现文本转语音
基于 MVDR 波束形成的语音增强
使用 Hybrid Demucs 进行音乐源分离
Torchaudio-Squim: TorchAudio 中的非侵入式语音评估
训练实用技巧
Conformer RNN-T 语音识别
Emformer RNN-T 语音识别
Conv-TasNet 源分离
HuBERT 预训练与微调(ASR)
实时音视频自动语音识别
Python API 参考文档
torchaudio
torchaudio.io
torchaudio.functional
torchaudio.transforms
torchaudio.datasets
torchaudio.models
torchaudio.models.decoder
torchaudio.pipelines
torchaudio.sox_effects
torchaudio.compliance.kaldi
torchaudio.kaldi_io
torchaudio.utils
torio
torio.io
torio.utils
Python 原型 API 参考
torchaudio.prototype
torchaudio.prototype.datasets
torchaudio.prototype.functional
torchaudio.prototype.models
torchaudio.prototype.pipelines
torchaudio.prototype.transforms
C++ 原型 API 参考
libtorio
torio::io::StreamingMediaDecoder
torio::io::StreamingMediaEncoder
PyTorch 库
PyTorch
torchaudio
torchtext
torchvision
TorchElastic
TorchServe
在 XLA 设备上使用 PyTorch
torchaudio.prototype.datasets
Musan
MUSAN
[
Snyder
等人
2015年
] 数据集。
本页目录