Torch audio 文档
索引
安装
API 教程
音频数据集
管道教程
训练实用技巧
Conformer RNN-T 语音识别
Emformer RNN-T 语音识别
Conv-TasNet 源分离
HuBERT 预训练与微调(ASR)
实时音视频自动语音识别
Python API 参考文档
Python 原型 API 参考
C++ 原型 API 参考
PyTorch 库
PyTorch
torchaudio
torchtext
torchvision
TorchElastic
TorchServe
在 XLA 设备上使用 PyTorch

torchaudio.prototype.functional

工具函数

barkscale_fbanks 创建频率区间转换矩阵。
chroma_filterbank 创建频率到色度转换矩阵。

DSP

adsr_envelope 生成 ADSR 包络
filter_waveform 沿给定波形的时间轴应用滤波器。
extend_pitch 用它们的倍数扩展给定的时间序列值。
oscillator_bank 从给定的瞬时频率和振幅合成波形。
sinc_impulse_response 为给定的截止频率创建窗函数 sinc 脉冲响应。
frequency_impulse_response 根据所需的频率响应创建滤波器

房间脉冲响应模拟

ray_tracing 通过光线追踪计算能量直方图。
simulate_rir_ism 根据以下内容计算房间脉冲响应 (RIR)image source method[Allen and Berkley, 1979]
本页目录