torch.cuda.comm.reduce_add torch.cuda.comm.reduce_add(inputs, destination=None)[源代码] 对来自多个GPU的张量进行求和。 所有的输入都应该有相同的形状、数据类型和布局。输出张量也将具有相同的形状、数据类型和布局。 参数 inputs (Iterable[Tensor]) - 需要相加的张量集合。 destination (int, 可选) – 输出将被放置的目标设备,默认为当前设备。 返回值 一个张量,包含了所有输入的逐元素求和结果,并放置在目标设备上。