Torch audio 文档
索引
安装
API 教程
音频数据集
管道教程
训练实用技巧
Conformer RNN-T 语音识别
Emformer RNN-T 语音识别
Conv-TasNet 源分离
HuBERT 预训练与微调(ASR)
实时音视频自动语音识别
Python API 参考文档
Python 原型 API 参考
C++ 原型 API 参考
PyTorch 库
PyTorch
torchaudio
torchtext
torchvision
TorchElastic
TorchServe
在 XLA 设备上使用 PyTorch

torchaudio.compliance.kaldi

kaldi 的有用处理操作可以通过 torchaudio 实现。提供了具有相同参数的各种函数,以便 torchaudio 能够生成类似的输出。

spectrogram 从原始音频信号创建频谱图。
fbank 从原始音频信号中创建 fbank。
mfcc 从原始音频信号中生成MFCC(梅尔频率倒谱系数)。
本页目录