torch.addbmm

torch.addbmm(input, batch1, batch2, *, beta=1, alpha=1, out=None) → Tensor

执行存储在batch1batch2中的矩阵批处理乘法,并减少加法步骤(所有矩阵乘法沿第一维度累加)。将input添加到最终结果中。

batch1batch2 都必须是三维张量,并且每个张量中包含的矩阵数量要相同。

如果 batch1 是一个 $(b \times n \times m)$ 张量,batch2 是一个 $(b \times m \times p)$ 张量,那么 input 必须与 $(n \times p)$ 张量进行广播操作 兼容,并且 out 将会是一个 $(n \times p)$ 张量。

$out = \beta\ \text{input} + \alpha\ (\sum_{i=0}^{b-1} \text{batch1}_i \mathbin{@} \text{batch2}_i)$

如果 beta 为 0,那么 input 将被忽略,并且其中的 naninf 不会被传播。

对于类型为FloatTensorDoubleTensor的输入,参数betaalpha必须是实数;如果不是这些类型,则它们应该是整数。

该操作支持TensorFloat32

在某些ROCm设备上,当使用float16输入时,此模块会采用不同的精度进行反向传播。

参数
  • batch1 (Tensor) – 第一批待相乘的矩阵

  • batch2 (Tensor) – 第二批要相乘的矩阵

关键字参数
  • beta (数字, 可选) – input 的乘数 ($\beta$)

  • input (Tensor) – 需要添加的矩阵

  • alpha (Number, optional) – 用于计算 batch1 @ batch2 的乘数($\alpha$

  • out (Tensor, 可选) – 指定输出张量。

示例:

>>> M = torch.randn(3, 5)
>>> batch1 = torch.randn(10, 3, 4)
>>> batch2 = torch.randn(10, 4, 5)
>>> torch.addbmm(M, batch1, batch2)
tensor([[  6.6311,   0.0503,   6.9768, -12.0362,  -2.1653],
        [ -4.8185,  -1.4255,  -6.6760,   8.9453,   2.5743],
        [ -3.8202,   4.3691,   1.0943,  -1.1109,   5.4730]])
本页目录