Torch audio 文档
索引
安装
API 教程
音频数据集
管道教程
训练实用技巧
Conformer RNN-T 语音识别
Emformer RNN-T 语音识别
Conv-TasNet 源分离
HuBERT 预训练与微调(ASR)
实时音视频自动语音识别
Python API 参考文档
Python 原型 API 参考
C++ 原型 API 参考
PyTorch 库
PyTorch
torchaudio
torchtext
torchvision
TorchElastic
TorchServe
在 XLA 设备上使用 PyTorch

torchaudio.kaldi_io

要使用此模块,需要安装依赖项 kaldi_io。这是一个围绕 kaldi_io 的轻量级封装,它返回 torch.Tensor

向量

read_vec_int_ark

torchaudio.kaldiio.readvecintark(fileorfd: Any) → Iterable[Tuple[str, Tensor]][source]

创建一个生成器,用于生成 (key, vector

参数:

  • file_or_fd (str/FileDescriptor) – ark 文件、gzipped ark 文件、管道或已打开的文件描述符

返回:

字符串为键,张量为从文件中读取的向量

返回类型:

Iterable[Tuple[str, Tensor]]

示例

>>> # read ark to a 'dictionary'
>>> d = { u:d for u,d in torchaudio.kaldi_io.read_vec_int_ark(file) }

read_vec_flt_scp

torchaudio.kaldi_io.read_vec_flt_scp(file_or_fd:Any) → Iterable[Tuple[str,Tensor]][source]

创建一个生成器,生成 (key, vector\

参数:

file_or_fd (str/FileDescriptor) – scp 文件、gzip 压缩的 scp 文件、管道或已打开的文件描述符

返回值:

字符串是键,张量是从文件中读取的向量

返回类型:

Iterable[Tuple[str, Tensor]]

示例

>>> # read scp to a 'dictionary'
>>> # d = { u:d for u,d in torchaudio.kaldi_io.read_vec_flt_scp(file) }

读取向量浮点 ark 文件

torchaudio.kaldi_io.read_vec_flt_ark(file_or_fd:Any) → Iterable[Tuple[str,Tensor]][source]

创建生成器,生成 (键, 向量\

参数:

file_or_fd (str/FileDescriptor) – ark 文件、gzipped ark 文件、管道或已打开的文件描述符

返回值:

字符串为键,张量为从文件中读取的向量

返回类型:

Iterable[Tuple[str, Tensor]]

示例

>>> # read ark to a 'dictionary'
>>> d = { u:d for u,d in torchaudio.kaldi_io.read_vec_flt_ark(file) }

矩阵

read_mat_scp

torchaudio.kaldi_io.read_mat_scp(file_or_fd:Any) → Iterable[Tuple[str,Tensor]][source]

创建一个生成器,生成 (key, matrix\

参数:

file_or_fd (str/FileDescriptor) – scp 文件、gzipped scp 文件、管道或已打开的文件描述符

返回值:

字符串是键,张量是从文件中读取的矩阵

返回类型:

Iterable[Tuple[str, Tensor]]

示例

>>> # read scp to a 'dictionary'
>>> d = { u:d for u,d in torchaudio.kaldi_io.read_mat_scp(file) }

读取矩阵归档文件

torchaudio.kaldi_io.read_mat_ark(file_or_fd:Any) → Iterable[Tuple[str,Tensor]][source]

创建一个生成器,生成 (key, matrix\

参数:

file_or_fd (str/FileDescriptor) – ark 文件、gzipped ark 文件、管道或已打开的文件描述符

返回:

字符串是键,张量是从文件中读取的矩阵

返回类型:

Iterable[Tuple[str, Tensor]]

示例

>>> # read ark to a 'dictionary'
>>> d = { u:d for u,d in torchaudio.kaldi_io.read_mat_ark(file) }
本页目录