DTypeWithConstraints
- 类 torch.ao.quantization.backend_config.DTypeWithConstraints(dtype=None, quant_min_lower_bound=None, quant_max_upper_bound=None, scale_min_lower_bound=None, scale_max_upper_bound=None, scale_exact_match=None, zero_point_exact_match=None)[源代码]
-
用于指定给定数据类型的附加约束配置,例如量化值范围、比例因子范围和固定量化参数。这些配置将在
DTypeConfig
中使用。目前支持的约束条件有:
-
quant_min_lower_bound 和 quant_max_upper_bound: 分别表示最小和最大量化值的下限和上限。如果 QConfig 的 quant_min 和 quant_max 超出此范围,则会忽略该 QConfig。
-
scale_min_lower_bound 和 scale_max_upper_bound: 分别表示最小缩放值和最大缩放值的下限和上限。如果 QConfig 的最小缩放值(当前显示为 eps)低于下限,则会忽略该 QConfig。需要注意的是,目前不强制执行上限。
-
scale_exact_match 和 zero_point_exact_match: 确保尺度和零点的精确匹配要求,适用于具有固定量化参数的操作符(如 sigmoid 和 tanh)。如果 QConfig 中指定的观察器既不是 FixedQParamsObserver 也不是 FixedQParamsFakeQuantize,或者量化参数不匹配,则会忽略该 QConfig。
-