torch.baddbmm
- torch.baddbmm(input, batch1, batch2, *, beta=1, alpha=1, out=None) → Tensor
-
计算
batch1
和batch2
中矩阵的批处理矩阵乘积,并将input
加到最终结果中。batch1
和batch2
都必须是三维张量,并且每个张量中包含的矩阵数量要相同。如果
batch1
是一个 $(b \times n \times m)$ 张量,batch2
是一个 $(b \times m \times p)$ 张量,则input
必须与一个 $(b \times n \times p)$ 张量进行广播操作,并且out
将是一个 $(b \times n \times p)$ 张量。alpha
和beta
的含义与torch.addbmm()
中使用的缩放因子相同。$\text{out}_i = \beta\ \text{input}_i + \alpha\ (\text{batch1}_i \mathbin{@} \text{batch2}_i)$如果
beta
为 0,那么input
将被忽略,并且其中的 nan 和 inf 不会被传播。对于类型为FloatTensor或DoubleTensor的输入,参数
beta
和alpha
必须是实数;如果不是这些类型,则它们应该是整数。该操作支持TensorFloat32。
在某些ROCm设备上,当使用float16输入时,此模块会采用不同的精度进行反向传播。
- 参数
- 关键字参数
-
-
beta (数字, 可选) –
input
的乘数 ($\beta$) -
alpha (Number, optional) – 用于 $\text{batch1} \mathbin{@} \text{batch2}$ 的乘数 ($\alpha$)
-
out (Tensor, 可选) – 指定输出张量。
-
示例:
>>> M = torch.randn(10, 3, 5) >>> batch1 = torch.randn(10, 3, 4) >>> batch2 = torch.randn(10, 4, 5) >>> torch.baddbmm(M, batch1, batch2).size() torch.Size([10, 3, 5])