torchaudio.kaldi_io
要使用此模块,需要安装依赖项 kaldi_io。这是一个围绕 kaldi_io
的轻量级封装,它返回 torch.Tensor
。
向量
read_vec_int_ark
torchaudio.kaldiio.readvecintark(fileorfd: Any) → Iterable[Tuple[str, Tensor]][source]
创建一个生成器,用于生成 (key, vector
参数:
- file_or_fd (str/FileDescriptor) – ark 文件、gzipped ark 文件、管道或已打开的文件描述符
返回:
字符串为键,张量为从文件中读取的向量
返回类型:
Iterable[Tuple[str, Tensor]]
示例
>>> # read ark to a 'dictionary'
>>> d = { u:d for u,d in torchaudio.kaldi_io.read_vec_int_ark(file) }
read_vec_flt_scp
torchaudio.kaldi_io.read_vec_flt_scp(file_or_fd:Any) → Iterable[Tuple[str,Tensor]][source]
创建一个生成器,生成 (key, vector\
参数:
file_or_fd (str/FileDescriptor) – scp 文件、gzip 压缩的 scp 文件、管道或已打开的文件描述符
返回值:
字符串是键,张量是从文件中读取的向量
返回类型:
Iterable[Tuple[str, Tensor]]
示例
>>> # read scp to a 'dictionary'
>>> # d = { u:d for u,d in torchaudio.kaldi_io.read_vec_flt_scp(file) }
读取向量浮点 ark 文件
torchaudio.kaldi_io.read_vec_flt_ark(file_or_fd:Any) → Iterable[Tuple[str,Tensor]][source]
创建生成器,生成 (键, 向量\
参数:
file_or_fd (str/FileDescriptor) – ark 文件、gzipped ark 文件、管道或已打开的文件描述符
返回值:
字符串为键,张量为从文件中读取的向量
返回类型:
Iterable[Tuple[str, Tensor]]
示例
>>> # read ark to a 'dictionary'
>>> d = { u:d for u,d in torchaudio.kaldi_io.read_vec_flt_ark(file) }
矩阵
read_mat_scp
torchaudio.kaldi_io.read_mat_scp(file_or_fd:Any) → Iterable[Tuple[str,Tensor]][source]
创建一个生成器,生成 (key, matrix\
参数:
file_or_fd (str/FileDescriptor) – scp 文件、gzipped scp 文件、管道或已打开的文件描述符
返回值:
字符串是键,张量是从文件中读取的矩阵
返回类型:
Iterable[Tuple[str, Tensor]]
示例
>>> # read scp to a 'dictionary'
>>> d = { u:d for u,d in torchaudio.kaldi_io.read_mat_scp(file) }
读取矩阵归档文件
torchaudio.kaldi_io.read_mat_ark(file_or_fd:Any) → Iterable[Tuple[str,Tensor]][source]
创建一个生成器,生成 (key, matrix\
参数:
file_or_fd (str/FileDescriptor) – ark 文件、gzipped ark 文件、管道或已打开的文件描述符
返回:
字符串是键,张量是从文件中读取的矩阵
返回类型:
Iterable[Tuple[str, Tensor]]
示例
>>> # read ark to a 'dictionary'
>>> d = { u:d for u,d in torchaudio.kaldi_io.read_mat_ark(file) }