torchaudio.datasets

所有数据集都是 torch.utils.data.Dataset 的子类，并且实现了 __getitem__ 和 __len__ 方法。

因此，它们都可以传递给 torch.utils.data.DataLoader，后者可以使用 torch.multiprocessing 工作进程并行加载多个样本。例如：

yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
    yesno_data,
    batch_size=1,
    shuffle=True,
    num_workers=args.nThreads)


`CMUARCTIC`	CMU ARCTIC[Komineket al., 2003] 数据集。
`CMUDict`	CMU 发音词典[Weide, 1998] (CMUDict) 数据集。
`COMMONVOICE`	CommonVoice[Ardila等人, 2020] 数据集。
`DR_VCTK`	设备录制的 VCTK（小型子集版本）[Sarfjoo 和 Yamagishi, 2018] 数据集。
`FluentSpeechCommands`	流畅语音指令[Lugosch等人, 2019] 数据集
`GTZAN`	GTZAN[Tzanetakis等人, 2001] 数据集。
`IEMOCAP`	IEMOCAP[Busso等人, 2008] 数据集。
`LibriMix`	LibriMix[Cosentino等人, 2020] 数据集。
`LIBRISPEECH`	LibriSpeech[Panayotovet al., 2015] 数据集。
`LibriLightLimited`	Libri-light 的子集 [Kahn等人，2020] 数据集，该数据集在 HuBERT [ 中被使用Hsuet al., 2021] 用于监督微调。
`LIBRITTS`	LibriTTS[Zenet al., 2019] 数据集。
`LJSPEECH`	LJSpeech-1.1[Ito 和 Johnson, 2017] 数据集。
`MUSDB_HQ`	MUSDB_HQ[Rafii等人, 2019] 数据集。
`QUESST14`	QUESST14[Miroet al., 2015] 数据集。
`Snips`	Snips[Coucke等人, 2018] 数据集。
`SPEECHCOMMANDS`	语音命令[Warden, 2018] 数据集。
`TEDLIUM`	Tedlium[Rousseau等人, 2012] 数据集（版本 1、2 和 3）。
`VCTK_092`	VCTK 0.92[Yamagishiet al., 2019] 数据集
`VoxCeleb1Identification`	VoxCeleb1[Nagraniet al., 2017用于说话人识别任务的]数据集。
`VoxCeleb1Verification`	VoxCeleb1[Nagrani等人, 2017用于说话人验证任务的]数据集。
`YESNO`	YesNo[YesNo, 无日期] 数据集。