当前位置: 首页 > news >正文

统计神经网络参数量、MAC、FLOPs等信息

0、基础提示

1、FLOPS是用来衡量硬件算力的指标,FLOPs用来衡量模型复杂度。
2、MAC 一般为 FLOPs的2倍
3、并非FLOPs越小在硬件上就一定运行更快,还与模型占用的内存,带宽,等有关

1、FLOPs计算

神经网络参数量。用于衡量模型大小。一般卷积计算方式为:
F L O P s = 2 ∗ H W ( K h ∗ K w ∗ C i n + 1 ) C o u t FLOPs = 2*HW(Kh*Kw*Cin+1)Cout FLOPs=2HW(KhKwCin+1)Cout
其中,
H,W表示该层卷积的高和宽
Kh,Kw表示卷积核的高和宽
2 表示一次乘操作 + 一次加操作
+1 表示bias操作

2、统计工具-THOP

源代码链接

2.1 安装

pip install thop

pip install --upgrade git+https://github.com/Lyken17/pytorch-OpCounter.git

2.2 基础使用

from torchvision.models import resnet50
from thop import profile
model = resnet50()
input = torch.randn(1, 3, 224, 224)
macs, params = profile(model, inputs=(input, ))

2.3 定义自己的规则

class YourModule(nn.Module):# your definitiondef count_your_model(model, x, y):# your rule hereinput = torch.randn(1, 3, 224, 224)
macs, params = profile(model, inputs=(input, ), custom_ops={YourModule: count_your_model})

2.4 模型包含多个输入

修改input就好

from torchvision.models import resnet50
from thop import profile
model = resnet50()
input1 = input2 = torch.randn(1, 3, 224, 224)
macs, params = profile(model, inputs=(input1, input2,))

3、 统计工具-torchstat

这个是我更中意的,因为他统计信息更加丰富,包含params,memory, Madd, FLOPs等。缺点在于已经不更新了,且不支持多输入,好在我们可以修改代码支持。
源代码链接

3.1 安装

pip install torchstat

3.2 基础使用

from torchstat import stat
import torchvision.models as models
model = models.resnet18()
stat(model, (3, 224, 224))

3.3 输入多个Input

将torchstat 库安装目录下的 torchstat/statistics.py 中按如下修改:

class ModelStat(object):def __init__(self, model, input_size, query_granularity=1):assert isinstance(model, nn.Module)# 删除输入长度为3的限制# assert isinstance(input_size, (tuple, list)) and len(input_size) == 3assert isinstance(input_size, (tuple, list))self._model = modelself._input_size = input_sizeself._query_granularity = query_granularity

将torchstat 库安装目录下的 torchstat/model_hook.py 中按如下修改:

class ModelHook(object):def __init__(self, model, input_size):assert isinstance(model, nn.Module)assert isinstance(input_size, (list, tuple))self._model = model# 原始是通过单个输入的尺寸,再构建输入tensor,我们可以修改为在网络外构建输入tensor后直接送入网络# self._input_size = input_sizeself._origin_call = dict() # sub module call hookself._hook_model()# x = torch.rand(1, *self._input_size) # add module duration timeself._model.eval()# self._model(x)self._model(*self._input_size)

使用时候测试代码

from torchstat import stat
import torchvision.models as models
model = models.resnet18()
input1, input2 = torch.rand(1, 3, 224, 224), torch.rand(1, 3, 224, 224)
stat(model, (input1, input2))

大致改动就是这样了,还有什么bug可以自己稍微修改一下哈。另外找修改地方可以看报错提示torchstat安装路径修改。

4、fvcore

stat有个很麻烦的问题是,他不支持transformer,因此包含transformer的网络可以使用fvcore,他是Facebook开源的一个轻量级的核心库。

4.1、 安装

pip install fvcore

4.2、 基础使用

from fvcore.nn import FlopCountAnalysis, parameter_count_table
# 创建网络
model = MobileViTBlock(in_channels=32, transformer_dim=64, ffn_dim=256)# 创建输入网络的tensor
tensor = (torch.rand(1, 32, 64, 64),)# 分析FLOPs
flops = FlopCountAnalysis(model, tensor)
print("FLOPs: ", flops.total())# 分析parameters
print(parameter_count_table(model))

参考来自:https://zhuanlan.zhihu.com/p/583106030

欢迎交流补充

http://www.lryc.cn/news/102797.html

相关文章:

  • 【多模态】21、BARON | 通过引入大量 regions 来提升模型开放词汇目标检测能力(CVPR2021)
  • Ansible 自动化运维
  • 指纹浏览器能为TikTok运营提供哪些便利?
  • 关于远程直接内存访问技术 RDMA 的高性能架构设计介绍 | 龙蜥技术
  • 【Boost搜索引擎项目】
  • JVM入门篇-JVM的概念与学习路线
  • “程序员求职攻略:IT技术岗面试的必备技巧“
  • 回归预测 | MATLAB实现WOA-ELM鲸鱼算法优化极限学习机多输入单输出回归预测
  • 方法的定义和格式
  • 【Linux】进程篇(补):简易 shell 的实现(进程深刻理解、内建命令的使用)
  • django Ajax--前后端数据交互
  • 【嵌入式学习笔记】嵌入式入门1——GPIO
  • [SQL挖掘机] - 多表连接: union
  • AI面试官:SQL Server数据库(三)
  • python刑事案卷图片转pdf
  • vue使用driver.js完成页面引导的功能
  • 学习中遇到的好博客
  • 在CSDN学Golang云原生(Kubernetes集群安全)
  • 浅谈深度神经网络
  • 『C语言初阶』第六章-操作符详解
  • 企业知识文档管理+群晖nas安全云存储
  • ​《吐血整理》进阶系列教程-拿捏Fiddler抓包教程(9)-Fiddler如何设置捕获Https会话​
  • 对比CahtGPT Bard Claude2对中文的理解
  • 安全测试国家标准解读——并发程序安全
  • 《吐血整理》进阶系列教程-拿捏Fiddler抓包教程(12)-Fiddler设置IOS手机抓包,你知多少???
  • MySQL中锁的简介——行级锁
  • 4 个最常见的自动化测试挑战及应对措施
  • 23款奔驰GLE450豪华型升级AMG直瀑式中网,战斗感立马提升了一个档次
  • ALLEGRO之Logic
  • 算法leetcode|64. 最小路径和(rust重拳出击)