当前位置：首页 > article >正文

OPenCV CUDA模块目标检测----- HOG 特征提取和目标检测类cv::cuda::HOG

article 2025/8/25 7:08:17

操作系统：ubuntu22.04
OpenCV版本：OpenCV4.9
IDE:Visual Studio Code
编程语言：C++11

算法描述

cv::cuda::HOG 是 OpenCV 的 CUDA 模块中对 HOG 特征提取和目标检测提供的 GPU 实现。它与 CPU 版本的 cv::HOGDescriptor 类似，但利用了 GPU 的并行计算能力以提高性能。

公共成员函数

创建与初始化

函数	描述
static Ptr cv::cuda::HOG::create()	创建一个默认配置的 HOG 对象。
void setSVMDetector(InputArray _svmDetector)	设置 SVM 分类器权重向量，用于检测特定目标（如行人）。

参数设置（与 HOG 特征相关）

函数	描述
void setWinSize(Size winSize)	设置检测窗口大小（必须是 cell 大小的整数倍）。
void setBlockSize(Size blockSize)	设置 block 的大小（单位：像素）。
void setCellSize(Size cellSize)	设置 cell 的大小（单位：像素）。
void setBinCount(int nBins)	设置每个 cell 的方向直方图 bin 数量。
void setBlockStride(Size blockStride)	设置 block 移动步长（单位：像素）。
void setDerivativeAperture(int derivAperture)	设置图像平滑/导数计算的孔径大小。
void setWinSigma(double winSigma)	高斯窗口的标准差。
void setHistogramNormType(int histogramNormType)	设置直方图归一化方式（L2Hys, L1, L1Sqrt, L2）。
void setL2HysNormalization(bool l2HysNormalization)	是否启用 L2-Hys 归一化。
void setGammaCorrection(bool gammaCorrection)	是否启用伽马校正。
void setNumLevels(int numLevels)	设置金字塔层数。

检测方法

函数	描述
void detectMultiScale(InputArray img, OutputArray foundLocations, double hitThreshold = 0, Size winStride = Size(), Size padding = Size())	在图像中多尺度检测目标，并返回检测到的位置（矩形框）。

示例代码（GPU 上的行人检测）

#include <opencv2/cudaobjdetect.hpp>
#include <opencv2/opencv.hpp>int main()
{// 创建 HOG 对象cv::Ptr< cv::cuda::HOG > hog = cv::cuda::HOG::create();// 设置 SVM 分类器（行人检测）std::vector< float > detector = cv::HOGDescriptor::getDefaultPeopleDetector();hog->setSVMDetector( detector );// 读取图像（默认为 BGR 三通道）cv::Mat frame = cv::imread( "/media/dingxin/data/study/OpenCV/sources/images/00001.jpg" );if ( frame.empty() ){std::cerr << "无法读取图像！" << std::endl;return -1;}// 转换为灰度图（CV_8UC1）cv::Mat gray_frame;cv::cvtColor( frame, gray_frame, cv::COLOR_BGR2GRAY );// 上传到 GPUcv::cuda::GpuMat d_frame( gray_frame );// 执行检测std::vector< cv::Rect > found_locations;hog->detectMultiScale( d_frame, found_locations );// 绘制检测结果for ( const auto& r : found_locations ){cv::rectangle( frame, r, cv::Scalar( 0, 0, 255 ), 2 );}cv::imshow( "Pedestrian Detection", frame );cv::waitKey( 0 );return 0;
}