torchaudio.datasets
所有数据集都是 torch.utils.data.Dataset
的子类,并且实现了 __getitem__
和 __len__
方法。
因此,它们都可以传递给 torch.utils.data.DataLoader
,后者可以使用 torch.multiprocessing
工作进程并行加载多个样本。例如:
yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
yesno_data,
batch_size=1,
shuffle=True,
num_workers=args.nThreads)
|
|
CMUARCTIC |
CMU ARCTIC[Komineket al., 2003] 数据集。 |
CMUDict |
CMU 发音词典[Weide, 1998] (CMUDict) 数据集。 |
COMMONVOICE |
CommonVoice[Ardila等人, 2020] 数据集。 |
DR_VCTK |
设备录制的 VCTK(小型子集版本)[Sarfjoo 和 Yamagishi, 2018] 数据集。 |
FluentSpeechCommands |
流畅语音指令[Lugosch等人, 2019] 数据集 |
GTZAN |
GTZAN[Tzanetakis等人, 2001] 数据集。 |
IEMOCAP |
IEMOCAP[Busso等人, 2008] 数据集。 |
LibriMix |
LibriMix[Cosentino等人, 2020] 数据集。 |
LIBRISPEECH |
LibriSpeech[Panayotovet al., 2015] 数据集。 |
LibriLightLimited |
Libri-light 的子集 [Kahn等人,2020] 数据集,该数据集在 HuBERT [ 中被使用Hsuet al., 2021] 用于监督微调。 |
LIBRITTS |
LibriTTS[Zenet al., 2019] 数据集。 |
LJSPEECH |
LJSpeech-1.1[Ito 和 Johnson, 2017] 数据集。 |
MUSDB_HQ |
MUSDB_HQ[Rafii等人, 2019] 数据集。 |
QUESST14 |
QUESST14[Miroet al., 2015] 数据集。 |
Snips |
Snips[Coucke等人, 2018] 数据集。 |
SPEECHCOMMANDS |
语音命令[Warden, 2018] 数据集。 |
TEDLIUM |
Tedlium[Rousseau等人, 2012] 数据集(版本 1、2 和 3)。 |
VCTK_092 |
VCTK 0.92[Yamagishiet al., 2019] 数据集 |
VoxCeleb1Identification |
VoxCeleb1[Nagraniet al., 2017用于说话人识别任务的]数据集。 |
VoxCeleb1Verification |
VoxCeleb1[Nagrani等人, 2017用于说话人验证任务的]数据集。 |
YESNO |
YesNo[YesNo, 无日期] 数据集。 |