FractionalMaxPool3d
- 类torch.nn.FractionalMaxPool3d(kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)[源代码]
-
对由多个输入平面组成的输入信号进行三维分数最大池化的操作。
Ben Graham 的论文 Fractional MaxPooling 中对 Fractional MaxPooling 作了详细的描述。
最大池化操作在一个由目标输出大小决定的随机步长的 $kT \times kH \times kW$ 区域内进行。输出特征的数量与输入平面的数量相等。
注意
必须定义
output_size
和output_ratio
中的一个,但不得同时定义两者。- 参数
-
-
kernel_size (Union[int, Tuple[int, int, int]]) – 窗口大小,用于取最大值。可以是一个整数 k(表示一个 k x k x k 的正方形核),或一个元组 (kt, kh, kw)
-
output_size (Union[int, Tuple[int, int, int]]) – 目标图像的输出大小,形式为 oT x oH x oW。可以是一个元组 (oT, oH, oW) 或者一个单一数字 oH 表示方形图像 oH x oH x oH
-
output_ratio (Union[float, Tuple[float, float, float]]) – 如果希望输出大小是输入大小的比例,可以使用此选项。该值必须是一个范围在 (0, 1) 内的数字或元组。
-
return_indices (bool) – 如果为
True
,将返回索引和输出。在传递给nn.MaxUnpool3d()
时有用。默认值:False
-
- 形状:
-
-
输入: (N, C, Tin, Hin, Win) 或 (C, Tin, Hin, Win).
-
输出: $(N, C, T_{\text{out}}, H_{\text{out}}, W_{\text{out}})$ 或 $(C, T_{\text{out}}, H_{\text{out}}, W_{\text{out}})$,其中 $(T_{\text{out}}, H_{\text{out}}, W_{\text{out}}) = \text{output\_size}$ 或 $(T_{\text{out}}, H_{\text{out}}, W_{\text{out}}) = \text{output\_ratio} \times (T_{\text{in}}, H_{\text{in}}, W_{\text{in}})$
-
示例
>>> # pool of cubic window of size=3, and target output size 13x12x11 >>> m = nn.FractionalMaxPool3d(3, output_size=(13, 12, 11)) >>> # pool of cubic window and target output size being half of input size >>> m = nn.FractionalMaxPool3d(3, output_ratio=(0.5, 0.5, 0.5)) >>> input = torch.randn(20, 16, 50, 32, 16) >>> output = m(input)