当前位置：首页 > news >正文

计算机视觉第一课opencv（一）保姆级教学

news 2025/8/8 8:52:01

简介

一、opencv的安装

1.安装opencv

2.pycharm补全问题

二、图像RGB

三、opencv基本操作

1.图像读取与显示

2.读取灰度图

3.ROI（感兴趣区域）

4.读取视频文件

5.颜色通道处理

6.通道合并

7.图片修改操作

7.1图片打码

7.2图片组合

7.3图片缩放

总结

简介

想踏入计算机视觉的大门，却被复杂的概念和工具吓退？OpenCV 作为视觉处理的 “瑞士军刀”，其实没那么难上手！本博客作为 “计算机视觉 OpenCV 第一课”，专为零基础新手打造保姆级教程：从 OpenCV 的安装（Windows/Linux/Mac 全平台覆盖），到第一个程序的编写与运行；从如何读取、显示、保存图片，到像素的基本操作（如修改颜色、裁剪图像），每一步都附带完整代码和清晰注释。无需高深的数学知识，也不用提前了解图像处理原理，跟着教程敲代码，你会发现：原来用几行代码就能让计算机 “看见” 并处理图像！我们还会用实例拆解常见报错的解决办法，帮你避开入门时的各种 “坑”。读完这个系列，你将掌握 OpenCV 的基础操作，为后续学习图像滤波、边缘检测、目标识别等进阶内容打下扎实基础，轻松迈出计算机视觉的第一步。

一、opencv的安装

1.安装opencv

打开cmd或者pycharm都可以进行下载

pip install opencv-python==3.4.18.65 -i https://pypi.tuna.tsinghua.edu.cn/simple

使用清华镜像园下载更快，这里建议不要安装最新的版本，还是使用相对中间的版本，这样后面不会跟其他的库产生冲突，后期因为库的报错问题比较少。

安装完opencv-Python我们接着安装opencv-contrib-python，它是安装 OpenCV 的 contrib 扩展模块（包含更多功能）

pip install opencv-contrib-python==3.4.18.65 -i https://pypi.tuna.tsinghua.edu.cn/simple

两个版本要相同，都出现成功安装的提示就是安装完成

2.pycharm补全问题

当我们安装完成准备去pycharm上使用发现导入opencv后没有补全功能，这是因为我们的版本不是最新的版本，需要我们去移动一个文件。

导入opencv

import cv2

我们要找到我们Python的安装目录比如我的

C:\Users\DELL\AppData\Local\Programs\Python\Python39

找到Lib目录下的第三方包

找到cv2找到里面的cv2.pyd文件复制到上一级目录里面也就是sit-packages下

这样我们就发现我们的补全正常了

二、图像RGB

我们要简单了解一下图像的一些基础知识

对于一个彩色的图像：

都是由RGB 三通道是数字图像表示颜色的基础方式，它通过红（Red）、绿（Green）、蓝（Blue）三种基本颜色的组合来呈现出丰富的色彩效果。

三通道的基本概念

对于一张彩色的图片读取可以发现是一个三维的数组，为：高度*宽度*通道

通道本质：每个通道都是一个二维矩阵，矩阵中的每个值代表该位置像素的亮度（0-255，0 为最暗，255 为最亮）
组合原理：每个像素的颜色由三个通道的对应位置值共同决定
存储形式：在 OpenCV 中，RGB 图像存储为形状为(高度, 宽度, 3)的 NumPy 数组，第三维对应三个通道

各通道的作用

红色通道（R）：控制像素中红色分量的强度
- 值越高，红色越鲜艳；值为 0 时无红色成分
绿色通道（G）：控制像素中绿色分量的强度
- 值越高，绿色越鲜艳；值为 0 时无绿色成分
蓝色通道（B）：控制像素中蓝色分量的强度
- 值越高，蓝色越鲜艳；值为 0 时无蓝色成分

三、opencv基本操作

现在有张彩色图片：

1.图像读取与显示

import cv2  # 读取的格式是BGR numpy
a = cv2.imread('dama.jpg')  # 读取图片，返回NumPy数组(BGR格式)
cv2.imshow('tu', a)         # 显示图片，参数为窗口名称和图像数据
b = cv2.waitKey(0)          # 等待用户按键，0表示无限等待
cv2.destroyAllWindows()     # 关闭所有窗口# 图像属性查看
print("图像形状(shape):", a.shape)  # (高度, 宽度, 通道数)
print("图像数据类型(dtype):", a.dtype)  # 通常是uint8(0-255)
print("图像大小(size):", a.size)   # 总像素数=高度×宽度×通道数

cv2.imread()默认读取彩色图像，格式为 BGR 而非 RGB
waitKey(0)会等待用户按下任意键，返回按键的 ASCII 码
对于简单程序，窗口会在程序结束时自动关闭

2.读取灰度图

import cv2
b = cv2.imread(r'dama.jpg', cv2.IMREAD_GRAYSCALE)  # 读取为灰度图
cv2.imshow('xx', b)
a = cv2.waitKey(0)
cv2.destroyAllWindows()# 灰度图属性
print("图像形状(shape):", b.shape)  # 灰度图只有高度和宽度，无通道数
print("图像数据类型(dtype):", b.dtype)
print("图像大小(size):", b.size)# 保存图片
cv2.imwrite('timg98_GRAY.jpg', b)  # 保存处理后的图像

cv2.IMREAD_GRAYSCALE等价于参数0，将图像转为单通道灰度图
cv2.imwrite()可以保存处理后的图像到指定文件

图片从彩色图片转化为灰度图就相当于三维数组转换为二维数组，也就是三通道转换为单通道。转换为灰度图像像素值会变小计算速度更快。

3.ROI（感兴趣区域）

我们也可以选取图像中的一部分

import cv2
a = cv2.imread(r'dama.jpg')
b = a[30:230, 100:300]  # 通过NumPy切片获取ROI，[行范围, 列范围]
cv2.imshow('yuantu', a)
cv2.imshow('qiepian', b)
cv2.waitKey(0)
cv2.destroyAllWindows()

ROI 是图像中需要重点处理的区域
切片语法为[y1:y2, x1:x2]，对应图像的高度范围和宽度范围