Torch audio 文档
索引
安装
API 教程
音频数据集
管道教程
训练实用技巧
Conformer RNN-T 语音识别
Emformer RNN-T 语音识别
Conv-TasNet 源分离
HuBERT 预训练与微调(ASR)
实时音视频自动语音识别
Python API 参考文档
Python 原型 API 参考
C++ 原型 API 参考
PyTorch 库
PyTorch
torchaudio
torchtext
torchvision
TorchElastic
TorchServe
在 XLA 设备上使用 PyTorch

安装预构建的二进制文件

torchaudio 提供了适用于 PyPI (pip) 和 Anaconda (conda) 的二进制发行版。

详情请参阅 https://pytorch.org/get-started/locally/

每个 torchaudio 包都是针对特定版本的 torch 编译的。请参考下表并安装正确的 torchtorchaudio 组合。

0.10 版本开始,torchaudio 提供了仅支持 CPU 和支持 CUDA 的二进制发行版,每个发行版都需要对应版本的 PyTorch 发行版。

该软件是使用未经修改的 FFmpeg 版本进行编译的,并移除了特定的 rpath 以支持使用系统库。LGPL 源码可以从以下位置下载:n4.1.8 (许可证)、n5.0.3 (许可证) 和 n6.0 (许可证)。

依赖项

  • PyTorch

    请参考下面的兼容性矩阵以了解受支持的 PyTorch 版本。

可选依赖项

  • FFmpeg

    使用 torchaudio.io 模块和 I/O 函数 中的 backend="ffmpeg" 时需要。

    从 2.1 版本开始,TorchAudio 官方二进制发行版兼容 FFmpeg 版本 6、5 和 4(>=4.4,<7)。在运行时,TorchAudio 首先查找 FFmpeg 6,如果未找到,则继续查找 5,最后查找 4。

    有多种安装 FFmpeg 库的方法。请参考官方文档了解如何安装 FFmpeg。如果您使用的是 Anaconda Python 发行版,conda install -c conda-forge 'ffmpeg<7' 将安装兼容的 FFmpeg 库。

    如果需要指定 TorchAudio 搜索和链接的 FFmpeg 版本,可以通过环境变量 TORIO_USE_FFMPEG_VERSION 来指定。例如,通过设置 TORIO_USE_FFMPEG_VERSION=5,TorchAudio 将仅查找 FFmpeg 5。

    如果由于某些原因,此搜索机制导致问题,您可以通过设置环境变量 TORIO_USE_FFMPEG=0 完全禁用 FFmpeg 集成。

    有多种安装 FFmpeg 库的方法。如果您使用的是 Anaconda Python 发行版,conda install -c conda-forge 'ffmpeg<7' 将安装兼容的 FFmpeg 库。

在搜索 FFmpeg 安装时,TorchAudio 查找带有版本号的库文件。即,Linux 上的 libavutil.so.<VERSION>,macOS 上的 libavutil.<VERSION>.dylib,以及 Windows 上的 avutil-<VERSION>.dll。许多公共预构建的二进制文件遵循此命名规则,但某些发行版使用无版本号的文件名。如果您在检测 FFmpeg 时遇到困难,请仔细检查您安装的库文件是否遵循此命名规则,(并确保它们位于库搜索路径中列出的目录之一。)

  • SoX

    I/O 函数 中使用 backend="sox" 时需要。

    从 2.1 版本开始,TorchAudio 需要单独安装 libsox。

    如果动态链接导致问题,您可以设置环境变量 TORCHAUDIO_USE_SOX=0,TorchAudio 将不会使用 SoX。

TorchAudio 查找无版本号的库文件,即 Linux 上的 libsox.so 和 macOS 上的 libsox.dylib。某些包管理器以不同的名称安装库文件。例如,Ubuntu 上的 aptitude 安装 libsox.so.3。为了让 TorchAudio 链接到它,您可以创建一个名为 libsox.so 的符号链接(并将符号链接放在库搜索路径中)。

TorchAudio 在 libsox 14.4.2 上进行了测试。(其他版本很可能无法工作。)

兼容性矩阵

TorchAudio 的官方二进制发行版包含用 C++ 编写的扩展模块,这些模块与特定版本的 PyTorch 链接。

不同版本的 TorchAudio 和 PyTorch 不能一起使用。请参考下表以获取匹配的版本。

PyTorch TorchAudio Python
2.1.0 2.1.0 >=3.8,<=3.11
2.0.1 2.0.2 >=3.8,<=3.11
2.0.0 2.0.1 >=3.8,<=3.11
1.13.1 0.13.1 >=3.7,<=3.10
1.13.0 0.13.0 >=3.7,<=3.10
1.12.1 0.12.1 >=3.7,<=3.10
1.12.0 0.12.0 >=3.7,<=3.10
1.11.0 0.11.0 >=3.7,<=3.9
1.10.0 0.10.0 >=3.6,<=3.9
1.9.1 0.9.1 >=3.6,<=3.9
1.8.1 0.8.1 >=3.6,<=3.9
1.7.1 0.7.2 >=3.6,<=3.9
1.7.0 0.7.0 >=3.6,<=3.8
1.6.0 0.6.0 >=3.6,<=3.8
1.5.0 0.5.0 >=3.5,<=3.8
1.4.0 0.4.0 ==2.7,>=3.5,<=3.8
本页目录