Torch audio 文档
索引
安装
API 教程
音频数据集
管道教程
训练实用技巧
Conformer RNN-T 语音识别
Emformer RNN-T 语音识别
Conv-TasNet 源分离
HuBERT 预训练与微调(ASR)
实时音视频自动语音识别
Python API 参考文档
Python 原型 API 参考
C++ 原型 API 参考
PyTorch 库
PyTorch
torchaudio
torchtext
torchvision
TorchElastic
TorchServe
在 XLA 设备上使用 PyTorch

torchaudio.prototype.transforms

BarkScale 将普通的短时傅里叶变换(STFT)转换为使用三角滤波器组的巴克频率STFT。
BarkSpectrogram 为原始音频信号创建 Bark 频谱图。
ChromaScale 将频谱图转换为色度图。
ChromaSpectrogram 生成音频信号的色谱图。
InverseBarkScale 从巴克频率域估计正常频率域的短时傅里叶变换。
本页目录