torch.baddbmm

torch.baddbmm(input, batch1, batch2, *, beta=1, alpha=1, out=None) → Tensor

计算batch1和batch2中矩阵的批处理矩阵乘积，并将input加到最终结果中。

batch1 和 batch2 都必须是三维张量，并且每个张量中包含的矩阵数量要相同。

如果 batch1 是一个 $(b \times n \times m)$ 张量，batch2 是一个 $(b \times m \times p)$ 张量，则 input 必须与一个 $(b \times n \times p)$ 张量进行广播操作，并且 out 将是一个 $(b \times n \times p)$ 张量。alpha 和 beta 的含义与 torch.addbmm() 中使用的缩放因子相同。

\text{out}_i = \beta\ \text{input}_i + \alpha\ (\text{batch1}_i \mathbin{@} \text{batch2}_i)

如果 beta 为 0，那么 input 将被忽略，并且其中的 nan 和 inf 不会被传播。

对于类型为FloatTensor或DoubleTensor的输入，参数beta和alpha必须是实数；如果不是这些类型，则它们应该是整数。

该操作支持TensorFloat32。

在某些ROCm设备上，当使用float16输入时，此模块会采用不同的精度进行反向传播。

参数

input (Tensor) – 需要添加的张量
batch1 (Tensor) – 第一批待相乘的矩阵
batch2 (Tensor) – 第二批要相乘的矩阵

关键字参数

beta (数字, 可选) – input 的乘数 ( $\beta$ )
alpha (Number, optional) – 用于 $\text{batch1} \mathbin{@} \text{batch2}$ 的乘数 ( $\alpha$ )
out (Tensor, 可选) – 指定输出张量。

示例：

>>> M = torch.randn(10, 3, 5)
>>> batch1 = torch.randn(10, 3, 4)
>>> batch2 = torch.randn(10, 4, 5)
>>> torch.baddbmm(M, batch1, batch2).size()
torch.Size([10, 3, 5])