Torch audio 文档
索引
安装
API 教程
音频数据集
管道教程
训练实用技巧
Conformer RNN-T 语音识别
Emformer RNN-T 语音识别
Conv-TasNet 源分离
HuBERT 预训练与微调(ASR)
实时音视频自动语音识别
Python API 参考文档
Python 原型 API 参考
C++ 原型 API 参考
PyTorch 库
PyTorch
torchaudio
torchtext
torchvision
TorchElastic
TorchServe
在 XLA 设备上使用 PyTorch

torchaudio.datasets

所有数据集都是 torch.utils.data.Dataset 的子类,并且实现了 __getitem____len__ 方法。

因此,它们都可以传递给 torch.utils.data.DataLoader,后者可以使用 torch.multiprocessing 工作进程并行加载多个样本。例如:

yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
    yesno_data,
    batch_size=1,
    shuffle=True,
    num_workers=args.nThreads)
CMUARCTIC CMU ARCTIC[Komineket al., 2003] 数据集。
CMUDict CMU 发音词典[Weide, 1998] (CMUDict) 数据集。
COMMONVOICE CommonVoice[Ardila等人, 2020] 数据集。
DR_VCTK 设备录制的 VCTK(小型子集版本)[Sarfjoo 和 Yamagishi, 2018] 数据集。
FluentSpeechCommands 流畅语音指令[Lugosch等人, 2019] 数据集
GTZAN GTZAN[Tzanetakis等人, 2001] 数据集。
IEMOCAP IEMOCAP[Busso等人, 2008] 数据集。
LibriMix LibriMix[Cosentino等人, 2020] 数据集。
LIBRISPEECH LibriSpeech[Panayotovet al., 2015] 数据集。
LibriLightLimited Libri-light 的子集 [Kahn等人,2020] 数据集,该数据集在 HuBERT [ 中被使用Hsuet al., 2021] 用于监督微调。
LIBRITTS LibriTTS[Zenet al., 2019] 数据集。
LJSPEECH LJSpeech-1.1[Ito 和 Johnson, 2017] 数据集。
MUSDB_HQ MUSDB_HQ[Rafii等人, 2019] 数据集。
QUESST14 QUESST14[Miroet al., 2015] 数据集。
Snips Snips[Coucke等人, 2018] 数据集。
SPEECHCOMMANDS 语音命令[Warden, 2018] 数据集。
TEDLIUM Tedlium[Rousseau等人, 2012] 数据集(版本 1、2 和 3)。
VCTK_092 VCTK 0.92[Yamagishiet al., 2019] 数据集
VoxCeleb1Identification VoxCeleb1[Nagraniet al., 2017用于说话人识别任务的]数据集。
VoxCeleb1Verification VoxCeleb1[Nagrani等人, 2017用于说话人验证任务的]数据集。
YESNO YesNo[YesNo, 无日期] 数据集。
本页目录