当前位置: 首页 > news >正文

libfacedetection 人脸检测库 检测速度慢的问题

目录

一、libfacedetection 性能介绍

英特尔CPU 使用AVX2指令集 使用AVX512指令集

嵌入式设备

 二、加速检测速度

libfacedetetion的前向推理速度很快的原因

使用axv2加速指令


一、libfacedetection 性能介绍

在上一篇文章中,我发现使用摄像头检测,构建方式为Release,检测耗时150ms左右。但是该项目github主页上的性能介绍是这样的:

英特尔CPU 使用AVX2指令集 使用AVX512指令集

嵌入式设备

 

 二、加速检测速度

libfacedetetion的前向推理速度很快的原因

作者主要使用了三个策略:

1 . 地址分配得当,从而使得conv,pooling等含有大量运算的模块可以做到连续访存。

2. arm上的neon加速指令intel cpu上的avx2加速指令的使用,这两个指令集分别可以使得连续四地址或者连续八地址的内存进行并行计算。1,2策略的结合使得运算速度大大提高。

3. 对计算量最大的conv模块进行了量化操作,开发了对应的int类型运算。

使用axv2加速指令

需要修改两个地方:

1、修改你项目工程的CMakeList.txt,增加以下内容

主要是AVX2指令可以加速检测,openMP有10ms左右的加速作用

 2、修改facedetectorcnn.h文件

取消AVX2的注释

现在摄像头输入1920*1080尺寸的检测耗时是70ms左右

于老师测试用的是 intel  i7-7820,输入尺寸未640*480单线程检测耗时50ms

yolov5n OpenCV DNN 推理 同尺寸摄像头输入 耗是140ms,相比较而言,libfacedetection确实快

有空得研究多线程,个位数的耗时也太诱人了!


 

参考:

libfacedetection 框架阅读及扩展经验_libfacedetection 解析_Rick51的博客-CSDN博客

libfacedetection 让人脸检测如此简单_AndroidKt的博客-CSDN博客

http://www.lryc.cn/news/64162.html

相关文章:

  • 项目骨架搭建
  • “火灾不分昼夜,安全在我心中”——五一前厂房消防检查纪实
  • UNIX环境高级编程——进程关系
  • C# ref和out用法和区别
  • 信息复制的革命:印刷术【提高信噪比】
  • 【MySQL】事务
  • 学习HCIP的day.03
  • Maven项目的配置
  • Spring Boot使用(基础)
  • 6WINDGate-overview
  • Java8新特性-流式操作
  • Nautilus Chain Layer 3 圆桌会议圆满举办,超4.8K用户观看
  • 本地elasticsearch中文分词器 ik分词器安装及使用
  • Java 中的异常处理机制是什么?如何使用它来处理程序中的异常?(七)
  • 基于UDQ的并网单相逆变器控制【同步参考系下单相并网全桥正弦PWM逆变器闭环控制】(Simulink)
  • JAVA开发——常用的注解
  • 【Java笔试强训 24】
  • SpringCloud详解
  • 如何保障网络安全
  • 网络基础:socket套接字
  • 程序员如何学好PHP?做好这五个方面就够了
  • 【开源项目】Build your own X 构建自己的项目
  • 在.NET Core中正确使用HttpClient的方式
  • 【C++】位运算类题目总结
  • Node服务端开发【NPM】
  • Doris(21):Doris的函数—日期函数
  • 和月薪5W的阿里程序员聊过后,才知道自己一直在打杂...
  • 西门子PLC沿脉冲类指令汇总
  • 软件多语言文案脚本自动化方案
  • C++017-C++文件读写应用