Torch audio 文档
索引
安装
API 教程
音频数据集
管道教程
训练实用技巧
Conformer RNN-T 语音识别
Emformer RNN-T 语音识别
Conv-TasNet 源分离
HuBERT 预训练与微调(ASR)
实时音视频自动语音识别
Python API 参考文档
Python 原型 API 参考
C++ 原型 API 参考
PyTorch 库
PyTorch
torchaudio
torchtext
torchvision
TorchElastic
TorchServe
在 XLA 设备上使用 PyTorch

在 Linux 和 macOS 上构建

1. 安装 Conda 并激活 conda 环境

请按照 https://docs.conda.io/en/latest/miniconda.html 上的说明进行操作

2. 安装 PyTorch

请从 https://pytorch.org/get-started/locally/ 选择您要安装的 PyTorch 版本。

在这里,我们安装的是 nightly 版本。

conda install pytorch -c pytorch-nightly

3. 安装构建工具

conda install cmake ninja

4. 克隆 torchaudio 仓库

git clone https://github.com/pytorch/audio
cd audio

5. 构建

python setup.py develop

由于构建过程的复杂性,TorchAudio 仅支持原地构建。要使用 pip,请使用 --no-use-pep517 选项。

pip install -v -e . --no-use-pep517

[可选] 使用自定义构建的 FFmpeg 构建 TorchAudio

默认情况下,torchaudio 尝试构建支持多个 FFmpeg 版本的 FFmpeg 扩展。此过程使用为特定 CPU 架构(如 x86_64aarch64arm64))预编译的 FFmpeg 库。

如果您的 CPU 不在这些架构中,构建过程可能会失败。为了解决这个问题,可以禁用 FFmpeg 集成(通过设置环境变量 USE_FFMPEG=0)或切换到单一版本的 FFmpeg 扩展。

要构建单一版本的 FFmpeg 扩展,用户必须提供 FFmpeg 二进制文件,并确保它们在构建环境中可用。为此,请安装 FFmpeg 并设置 FFMPEG_ROOT 环境变量以指定 FFmpeg 的位置。

conda install -c conda-forge ffmpeg
FFMPEG_ROOT=${CONDA_PREFIX} python setup.py develop
本页目录