当前位置: 首页 > article >正文

使用 C/C++ 和 OpenCV 提取图像的感兴趣区域 (ROI)

使用 C/C++ 和 OpenCV 提取图像的感兴趣区域 (ROI)

在计算机视觉中,感兴趣区域 (Region of Interest, ROI) 是指从图像中选择的一个特定区域,我们希望对其进行进一步的处理或分析。例如,在人脸识别中,ROI 就是包含人脸的矩形框。OpenCV 提供了简单而高效的方法来提取 ROI。

本文将介绍如何使用 C++ 和 OpenCV 库来从图像中提取 ROI。

主要方法:使用 cv::Rect

最常用、最直接的方法是使用 cv::Rect 对象来定义 ROI。cv::Rect 指定了一个矩形区域,包含其左上角的坐标 (x, y) 以及矩形的宽度和高度。

核心步骤

  1. 加载图像:使用 cv::imread() 函数将图像读入一个 cv::Mat 对象。
  2. 定义矩形:创建一个 cv::Rect 对象,指定 ROI 的位置和尺寸。
  3. 提取 ROI:利用 cv::Mat 的括号 () 运算符,并传入 cv::Rect 对象来裁剪出 ROI。
  4. 显示结果:使用 cv::imshow() 分别显示原始图像和提取出的 ROI。

完整示例代码 👨‍💻

这是一个完整的 C++ 示例,它加载一张图片,从中提取一个指定的矩形区域,并同时显示原始图和 ROI 图。

#include <opencv2/opencv.hpp>
#include <iostream>int main() {// 1. 读取原始图像// 确保图像文件 (例如 "sample_image.jpg") 在你的工作目录下,或提供完整路径cv::Mat originalImage = cv::imread("sample_image.jpg");if (originalImage.empty()) {std::cerr << "Error: Could not load the image!" << std::endl;return -1;}// 2. 定义 ROI 的矩形区域// cv::Rect(x, y, width, height)// - x: ROI 左上角的 x 坐标// - y: ROI 左上角的 y 坐标// - width: ROI 的宽度// - height: ROI 的高度//// 假设我们想从坐标 (250, 100) 开始,提取一个 300x400 大小的区域int x = 250;int y = 100;int width = 300;int height = 400;// 安全检查:确保定义的 ROI 没有超出原始图像的边界if ((x + width > originalImage.cols) || (y + height > originalImage.rows)) {std::cerr << "Error: The defined ROI exceeds the image boundaries!" << std::endl;return -1;}cv::Rect roiRect(x, y, width, height);// 3. 提取 ROI// 使用矩形对象来索引原始图像,创建一个指向 ROI 的 Mat 头cv::Mat roiImage = originalImage(roiRect);// 4. 显示结果cv::imshow("Original Image", originalImage);cv::imshow("ROI Image", roiImage);// 等待用户按键后退出cv::waitKey(0);cv::destroyAllWindows();return 0;
}

如何编译和运行 (使用 CMake)

使用 CMake 是管理 C++ 和 OpenCV 项目的标准方式。

  1. 将以上代码保存为 extract_roi.cpp
  2. 在同一目录下创建 CMakeLists.txt 文件:
    cmake_minimum_required(VERSION 3.10)
    project(ExtractROI_Project)find_package(OpenCV REQUIRED)include_directories(${OpenCV_INCLUDE_DIRS})add_executable(extract_roi extract_roi.cpp)
    target_link_libraries(extract_roi ${OpenCV_LIBS})
    
  3. 准备一张图片,并将其命名为 sample_image.jpg(或修改代码中的文件名)。
  4. 在终端中执行以下命令进行编译和运行:
    mkdir build
    cd build
    cmake ..
    make
    ./extract_roi
    

运行后,你将看到两个窗口,一个显示原始全图,另一个仅显示你提取的感兴趣区域。


重要提示:视图 vs. 拷贝 ⚠️

默认情况下,通过 image(roiRect) 操作创建的 cv::Mat 不是一个独立的数据拷贝,而是一个指向原始图像内存的视图 (View) 或称“头 (Header)”。

这意味着:

  • 内存共享roiImageoriginalImage 共享同一块图像数据。
  • 双向影响:如果你在 roiImage 上绘制或进行修改,这些改动会直接反映在 originalImage 的对应区域

如何创建独立拷贝?

如果你希望对 ROI 进行修改而不影响原始图像,你需要创建一个数据的深拷贝 (Deep Copy)。这可以通过 clone()copyTo() 方法实现。

// 方法 1: 使用 clone()
cv::Mat roi_clone = originalImage(roiRect).clone();// 方法 2: 使用 copyTo()
cv::Mat roi_copy;
originalImage(roiRect).copyTo(roi_copy);

现在,对 roi_cloneroi_copy 的任何修改都将是独立的,不会影响 originalImage


掌握 ROI 提取是进行目标检测、图像分割和许多其他高级计算机视觉任务的基础。希望这篇文章能帮助你入门!

http://www.lryc.cn/news/2404040.html

相关文章:

  • TripGenie:畅游济南旅行规划助手:个人工作纪实(二十二)
  • 如何用AI高效运营1000+Tiktok矩阵账号
  • 杭州瑞盟 MS35774/MS35774A 低噪声256细分微步进电机驱动,用于空调风门电机驱动,香薰电机驱动
  • 【论文解读】Toolformer: 语言模型自学使用工具
  • 408第一季 - 数据结构 - 线性表II
  • 网络通讯知识——通讯分层介绍,gRPC,RabbitMQ分层
  • Linux与Windows切换使用Obsidian,出现 unexplained changes 问题的解决
  • 基于VMD-LSTM融合方法的F10.7指数预报
  • 35 C 语言字符串转数值函数详解:strtof、strtod、strtold(含 errno 处理、ERANGE 错误)
  • 解决 idea提示`SQL dialect is not configured` 问题
  • springboot的test模块使用Autowired注入失败
  • 日志收集工具-Filebeat
  • 【PCIe总线】 -- PCI、PCIe相关实现
  • Vue3学习(4)- computed的使用
  • 手机上网可以固定ip地址吗?详细解析
  • 电脑同时连接内网和外网的方法,附外网连接局域网的操作设置
  • 如何在Unity中实现点击一个按钮跳转到哔哩哔哩
  • DHCP 动态主机配置协议(Dynamic host configuration protocol)逐层封装过程: DHCP --> UDP --> IP
  • PySide6 GUI 学习笔记——常用类及控件使用方法(单行文本控件QLineEdit)
  • 【数据结构】6. 时间与空间复杂度
  • Python 函数全攻略:函数进阶(生成器、闭包、内置函数、装饰器、推导式)
  • 基于springboot的藏文古籍系统
  • 重构城市应急指挥布控策略 ——无人机智能视频监控的破局之道
  • 声音信号的基频检测(python版本)
  • STM32 控制12VRGB灯带颜色亮度调节,TFTLCD显示
  • Hive开窗函数的进阶SQL案例
  • 【JJ斗地主-注册安全分析报告】
  • 《绩效管理》要点总结与分享
  • Microsoft前后端不分离编程新风向:cshtml
  • 【评测】用Flux的图片文本修改的PS效果