FractionalMaxPool2d

classtorch.nn.FractionalMaxPool2d(kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)[源代码]

对由多个输入平面组成的二维输入信号进行二维分数最大池化。

Ben Graham 的论文 Fractional MaxPooling 中对 Fractional MaxPooling 作了详细的描述。

最大池化操作在一个由目标输出大小决定的随机步长的$kH \times kW$区域内进行。输出特征的数量与输入平面的数量相等。

注意

必须定义output_sizeoutput_ratio中的一个,但不得同时定义两者。

参数
  • kernel_size (Union[int, Tuple[int, int]]) – 窗口大小,用于计算最大值。可以是一个整数 k(表示一个 k x k 的正方形核)或一个元组 (kh, kw)

  • output_size (Union[int, Tuple[int, int]]) – 目标图像的输出大小,形式为 oH x oW。可以是一个元组 (oH, oW) 或者一个单一数字 oH 表示方形图像 oH x oH。需要注意的是,必须满足条件:$kH + oH - 1 <= H_{in}$$kW + oW - 1 <= W_{in}$

  • output_ratio (Union[float, Tuple[float, float]]) – 如果希望输出大小是输入大小的比例,可以使用此选项。这必须是一个范围在 (0, 1) 内的数字或元组。注意需要满足以下条件:$kH + (output\_ratio\_H * H_{in}) - 1 <= H_{in}$$kW + (output\_ratio\_W * W_{in}) - 1 <= W_{in}$

  • return_indices (bool) – 如果为True,将返回索引和输出。 传递给nn.MaxUnpool2d()时有用。 默认值:False

形状:
  • 输入: $(N, C, H_{in}, W_{in})$$(C, H_{in}, W_{in})$

  • 输出: $(N, C, H_{out}, W_{out})$$(C, H_{out}, W_{out})$,其中 $(H_{out}, W_{out})$ 等于 \text{output\_size} 或者等于 \text{output\_ratio} \times (H_{in}, W_{in})$.

示例

>>> # pool of square window of size=3, and target output size 13x12
>>> m = nn.FractionalMaxPool2d(3, output_size=(13, 12))
>>> # pool of square window and target output size being half of input image size
>>> m = nn.FractionalMaxPool2d(3, output_ratio=(0.5, 0.5))
>>> input = torch.randn(20, 16, 50, 32)
>>> output = m(input)
本页目录