QConfig
- 类torch.ao.quantization.qconfig.QConfig(activation, weight)[源代码]
-
描述了如何通过为激活和权重分别提供设置(观察者类)来量化网络中的一个层或部分。
请注意,QConfig 需要包含观察者的 类(如 MinMaxObserver),或者一个在被调用时返回实例的可调用对象,而不是具体的观察者实例本身。量化准备函数会为每一层多次创建观察者。
观察者类通常有合理的默认参数,但可以通过with_args方法(行为类似
functools.partial
)来覆盖这些参数:my_qconfig = QConfig( activation=MinMaxObserver.with_args(dtype=torch.qint8), weight=default_observer.with_args(dtype=torch.qint8))