安装预构建的二进制文件
torchaudio
提供了适用于 PyPI (pip
) 和 Anaconda (conda
) 的二进制发行版。
详情请参阅 https://pytorch.org/get-started/locally/。
每个
torchaudio
包都是针对特定版本的torch
编译的。请参考下表并安装正确的torch
和torchaudio
组合。从
0.10
版本开始,torchaudio 提供了仅支持 CPU 和支持 CUDA 的二进制发行版,每个发行版都需要对应版本的 PyTorch 发行版。该软件是使用未经修改的 FFmpeg 版本进行编译的,并移除了特定的 rpath 以支持使用系统库。LGPL 源码可以从以下位置下载:n4.1.8 (许可证)、n5.0.3 (许可证) 和 n6.0 (许可证)。
依赖项
-
PyTorch
请参考下面的兼容性矩阵以了解受支持的 PyTorch 版本。
可选依赖项
-
使用
torchaudio.io
模块和 I/O 函数 中的backend="ffmpeg"
时需要。从 2.1 版本开始,TorchAudio 官方二进制发行版兼容 FFmpeg 版本 6、5 和 4(>=4.4,<7)。在运行时,TorchAudio 首先查找 FFmpeg 6,如果未找到,则继续查找 5,最后查找 4。
有多种安装 FFmpeg 库的方法。请参考官方文档了解如何安装 FFmpeg。如果您使用的是 Anaconda Python 发行版,
conda install -c conda-forge 'ffmpeg<7'
将安装兼容的 FFmpeg 库。如果需要指定 TorchAudio 搜索和链接的 FFmpeg 版本,可以通过环境变量
TORIO_USE_FFMPEG_VERSION
来指定。例如,通过设置TORIO_USE_FFMPEG_VERSION=5
,TorchAudio 将仅查找 FFmpeg 5。如果由于某些原因,此搜索机制导致问题,您可以通过设置环境变量
TORIO_USE_FFMPEG=0
完全禁用 FFmpeg 集成。有多种安装 FFmpeg 库的方法。如果您使用的是 Anaconda Python 发行版,
conda install -c conda-forge 'ffmpeg<7'
将安装兼容的 FFmpeg 库。
在搜索 FFmpeg 安装时,TorchAudio 查找带有版本号的库文件。即,Linux 上的
libavutil.so.<VERSION>
,macOS 上的libavutil.<VERSION>.dylib
,以及 Windows 上的avutil-<VERSION>.dll
。许多公共预构建的二进制文件遵循此命名规则,但某些发行版使用无版本号的文件名。如果您在检测 FFmpeg 时遇到困难,请仔细检查您安装的库文件是否遵循此命名规则,(并确保它们位于库搜索路径中列出的目录之一。)
-
在 I/O 函数 中使用
backend="sox"
时需要。从 2.1 版本开始,TorchAudio 需要单独安装 libsox。
如果动态链接导致问题,您可以设置环境变量
TORCHAUDIO_USE_SOX=0
,TorchAudio 将不会使用 SoX。
TorchAudio 查找无版本号的库文件,即 Linux 上的
libsox.so
和 macOS 上的libsox.dylib
。某些包管理器以不同的名称安装库文件。例如,Ubuntu 上的 aptitude 安装libsox.so.3
。为了让 TorchAudio 链接到它,您可以创建一个名为libsox.so
的符号链接(并将符号链接放在库搜索路径中)。TorchAudio 在 libsox 14.4.2 上进行了测试。(其他版本很可能无法工作。)
-
在 I/O 函数 中使用
backend="soundfile"
时需要。 -
使用 Emformer RNN-T 进行自动语音识别时需要。您可以通过运行
pip install sentencepiece
来安装它。 -
使用 Tacotron2 文本转语音 进行文本转语音时需要。
-
使用
torchaudio.kaldi_io
模块时需要。
兼容性矩阵
TorchAudio 的官方二进制发行版包含用 C++ 编写的扩展模块,这些模块与特定版本的 PyTorch 链接。
不同版本的 TorchAudio 和 PyTorch 不能一起使用。请参考下表以获取匹配的版本。
PyTorch |
TorchAudio |
Python |
---|---|---|
2.1.0 |
2.1.0 |
>=3.8 ,<=3.11 |
2.0.1 |
2.0.2 |
>=3.8 ,<=3.11 |
2.0.0 |
2.0.1 |
>=3.8 ,<=3.11 |
1.13.1 |
0.13.1 |
>=3.7 ,<=3.10 |
1.13.0 |
0.13.0 |
>=3.7 ,<=3.10 |
1.12.1 |
0.12.1 |
>=3.7 ,<=3.10 |
1.12.0 |
0.12.0 |
>=3.7 ,<=3.10 |
1.11.0 |
0.11.0 |
>=3.7 ,<=3.9 |
1.10.0 |
0.10.0 |
>=3.6 ,<=3.9 |
1.9.1 |
0.9.1 |
>=3.6 ,<=3.9 |
1.8.1 |
0.8.1 |
>=3.6 ,<=3.9 |
1.7.1 |
0.7.2 |
>=3.6 ,<=3.9 |
1.7.0 |
0.7.0 |
>=3.6 ,<=3.8 |
1.6.0 |
0.6.0 |
>=3.6 ,<=3.8 |
1.5.0 |
0.5.0 |
>=3.5 ,<=3.8 |
1.4.0 |
0.4.0 |
==2.7 ,>=3.5 ,<=3.8 |