当前位置：首页 > news >正文

PyTorch quantization observer

news 2025/8/4 1:26:53

文章目录

PyTorch quantization observer
- basic class
- standard observer
- substandard observer

PyTorch quantization observer

basic class

name	inherit	describe
ObserverBase	ABC, nn.Module	Base observer Module
UniformQuantizationObserverBase	ObserverBase

standard observer

name	inherit	describe
MinMaxObserver	UniformQuantizationObserverBase	computing the quantization parameters based on the running min and max values
MovingAverageMinMaxObserver	MinMaxObserver	computing the quantization parameters based on the moving average of the min and max values
PerChannelMinMaxObserver	UniformQuantizationObserverBase	computing the quantization parameters based on the running per channel min and max values
MovingAveragePerChannelMinMaxObserver	PerChannelMinMaxObserver	computing the quantization parameters based on the running per channel min and max values
HistogramObserver	UniformQuantizationObserverBase	records the running histogram of tensor values along with min/max values.
PlaceholderObserver	ObserverBase	doesn’t do anything and just passes its configuration to the quantized module’s `.from_float()`.
RecordingObserver	ObserverBase	mainly for debug and records the tensor values during runtime.
NoopObserver	ObserverBase	doesn’t do anything and just passes its configuration to the quantized module’s `.from_float()`.
FixedQParamsObserver	ObserverBase
ReuseInputObserver	ObserverBase

substandard observer

name	inherit	describe
default_observer	MinMaxObserver	quant_min=0, quant_max=127
default_placeholder_observer	PlaceholderObserver	Default placeholder observer, usually used for quantization to torch.float16.
default_debug_observer	RecordingObserver	Default debug-only observer.
default_weight_observer	MinMaxObserver	dtype=torch.qint8, qscheme=torch.per_tensor_symmetric
default_histogram_observer	HistogramObserver	quant_min=0, quant_max=127
default_per_channel_weight_observer	PerChannelMinMaxObserver	dtype=torch.qint8, qscheme=torch.per_channel_symmetric
default_dynamic_quant_observer	PlaceholderObserver	dtype=torch.float, compute_dtype=torch.quint8
default_float_qparams_observer	PerChannelMinMaxObserver	dtype=torch.quint8, qscheme=torch.per_channel_affine_float_qparams, ch_axis=0
weight_observer_range_neg_127_to_127	MinMaxObserver	dtype=torch.qint8, qscheme=torch.per_tensor_symmetric, quant_min=-127, quant_max=127, eps=2 ** -12
per_channel_weight_observer_range_neg_127_to_127	MinMaxObserver	dtype=torch.qint8, qscheme=torch.per_channel_symmetric, quant_min=-127, quant_max=127, eps=2 ** -12
default_float_qparams_observer_4bit	PerChannelMinMaxObserver	dtype=torch.quint4x2, qscheme=torch.per_channel_affine_float_qparams, ch_axis=0
default_fixed_qparams_range_neg1to1_observer	FixedQParamsObserver	scale=2.0 / 256.0, zero_point=128, dtype=torch.quint8, quant_min=0, quant_max=255
default_fixed_qparams_range_0to1_observer	FixedQParamsObserver	scale=1.0 / 256.0, zero_point=0, dtype=torch.quint8, quant_min=0, quant_max=255
default_symmetric_fixed_qparams_observer	default_fixed_qparams_range_neg1to1_observer
default_affine_fixed_qparams_observer	default_fixed_qparams_range_0to1_observer
default_reuse_input_observer	ReuseInputObserver

http://www.lryc.cn/news/97747.html

相关文章：

垃圾回收之三色标记法（Tri-color Marking）

Individual household electric power consumption个人家庭用电量数据挖掘与时序预测建模

实验三贪心算法

详解go的hex.Encode原理

R730服务器用光盘安装系统(Esxi系统)

SpringCloud nacos 集成 gateway ，实现动态路由

flutter：角标

基于JAVA SpringBoot和Vue高考志愿填报辅助系统

[php-cos]ThinkPHP项目集成腾讯云储存对象COS

DuckDB全面挑战SQLite

Elasticsearch查询裁剪

Hadoop——Hive运行环境搭建

(vue)vue项目中引入外部字体

ChatGPT在语义理解和信息提取中的应用如何？

Mysql-主从复制与读写分离

算法练习（3）：牛客在线编程04 堆/栈/队列

mac下安装vue cli脚手架并搭建一个简易项目

尝试-InsCode Stable Diffusion 美图活动一期

【OpenGL学习】之着色器GLSL基础

Python爬虫基础知识点有哪些

【CSS】 vh、rem 和 px 的区别

如何设置板子从emmc启动-针对imx6ull

使用Newtonsoft直接读取Json格式文本（Linq to Json）

服务器用友数据库中了locked勒索病毒后怎么解锁数据恢复

Linux-MariaDB数据库的备份与初始化

springboot-redis使用fastjson2

SOC FPGA之HPS模型设计(二)

Go基础—反射，性能和灵活性的双刃剑

MATLAB与ROS联合仿真（慕羽☆）全套开源资料索引

三、深入浅出WPF之控件与布局