FusedMovingAvgObsFakeQuantize

torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=0, quant_max=255, **observer_kwargs)[源代码]

定义一个融合模块来监控张量。

这是一个融合模块,用于观察输入张量并计算其最小值和最大值,进而计算出缩放因子和零点,并对张量进行假量化处理。该模块采用类似于MovingAverageMinMaxObserver的方法来计算输入数据的最小值和最大值,以确定缩放因子和零点。通过观察器中的qscheme参数可以区分不同的量化方案(如对称或仿射)。

此模块的输出为 x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max) - zero_point) * scale

类似于 FakeQuantize,并且接受相同的基类属性。

本页目录