torch.cuda.comm.reduce_add

torch.cuda.comm.reduce_add(inputs, destination=None)[源代码]

对来自多个GPU的张量进行求和。

所有的输入都应该有相同的形状、数据类型和布局。输出张量也将具有相同的形状、数据类型和布局。

参数
  • inputs (Iterable[Tensor]) - 需要相加的张量集合。

  • destination (int, 可选) – 输出将被放置的目标设备,默认为当前设备。

返回值

一个张量,包含了所有输入的逐元素求和结果,并放置在目标设备上。

本页目录