当前位置: 首页 > news >正文

OpenCV学习(4.5) 图像的形态转换

1.目标

在本教程中:

  • 我们将学习不同的形态操作,如腐蚀、膨胀、开、闭等。
  • 我们将看到不同的函数,如: cv.erode()**、 **cv.dilate()**、 **cv.morphologyEx() 等。

理论:

图像的形态转换是图像处理中的一个重要领域,它基于数学形态学(Mathematical Morphology)的原理。数学形态学是一种基于集合论和积分几何的非线性图像处理方法,主要用于提取图像中的形状特征、滤波、图像分割、特征提取等。形态学变换是基于图像形状的一些简单操作。它通常在二值图像上执行。它需要两个输入,一个是我们的原始图像,第二个是决定操作性质的结构元素或内核。形态转换通常涉及基本的操作,如腐蚀(Erosion)、膨胀(Dilation)、开运算(Opening)、闭运算(Closing)等,以及这些基本操作的组合。

2.腐蚀

腐蚀的基本概念就像土壤侵蚀一样,只侵蚀前景对象的边界(总是尽量保持前景为白色)。那它有什么作用呢?内核在图像中滑动(如二维卷积)。只有当内核下的所有像素都为 1 时,原始图像中的像素(1 或 0)才会被视为 1,否则会被侵蚀(变为零)。

所以根据内核的大小,边界附近的所有像素都将被丢弃。因此,前景对象的厚度或大小在图像中减少或只是白色区域减少。它有助于消除小的白色噪音(如我们在“颜色空间”一章中所看到的),分离两个连接的对象等。

作为一个例子,我将使用一个 5x5 内核,内核元素均为1。让我们看看它是如何工作的:

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img = cv.imread(r'D:\study\EmotionDetection_RealTime-master\data\data\te\07.jpg')
# blur = cv.blur(img,(5,5))
kernel = np.ones((5, 5), np.uint8)eroded_image = cv.erode(img, kernel, iterations=1)
plt.subplot(121),plt.imshow(img),plt.title('Original')
plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(eroded_image),plt.title('Blurred')
plt.xticks([]), plt.yticks([])
plt.show()

腐蚀的基本概念就像土壤侵蚀一样,只侵蚀前景对象的边界(总是尽量保持前景为白色) 

 

 腐蚀的基本概念就像土壤侵蚀一样,只侵蚀前景对象的边界,对于黑色部分来说就是进行膨胀操作。

 

左侧是原始的清晰图像,右侧则是应用了图像腐蚀技术后的效果,您可以看到细节部分变得模糊,边缘减少了,对比度也有所降低 

3. 膨胀 

它与腐蚀正好相反。这里,如果内核下至少有一个像素为“1”,则像素元素为“1”。所以它会增加图像中的白色区域,或者增加前景对象的大小。通常情况下,在去除噪音的情况下,腐蚀后会膨胀。因为,腐蚀消除了白噪声,但它也缩小了我们的对象。所以我们扩大它。由于噪音消失了,它们不会再回来,但我们的目标区域会增加到腐蚀之前的状态。它还可用于连接对象的断开部分。

dilation = cv.dilate(img,kernel,iterations = 1)

 通常用于增加图像中的明亮区域或填充图像中的孔洞

可以明显感觉到,画面变亮了。

4.开运算

开运算是图像处理中的一种形态学操作,它首先对图像进行腐蚀,然后进行膨胀。这种操作通常用于去除图像中的噪声和小的明亮区域,同时保持图像的大致形状和结构不变。

开只是腐蚀的另一个名称,随后是膨胀。正如我们上面所解释的,它对消除噪音很有用。在这里,我们使用 **cv.morphologyEx()**。

opening = cv.morphologyEx(img, cv.MORPH_OPEN, kernel)

将图像放大一点看,可以看到第二张加入高斯噪声后,通过开运算去除了这些噪声,并将图像前景进行膨胀。

笔者认为,这些噪声由于是散乱分布的,再进行二值化时部分被划为前景,部分被划为背景,但无论是前景还是背景,它们都是孤立的,第一步的腐蚀会去除哪些孤立的前景噪声,第二部 

 

这个是先进行腐蚀再进行膨胀的效果图,腐蚀除了将背景的噪声去除外,一些背景中的纹理也在一定程度的隐去了,而膨胀可以将这些纹理再现出来,甚至比原图还要强。 

5.闭运算

闭运算是图像处理中的一种形态学操作,它首先对图像进行膨胀,然后进行腐蚀。这种操作通常用于填充图像中的暗色区域和孔洞,同时保持图像的大致形状和结构不变。

 关闭与打开相反,膨胀后腐蚀。它在填充前景对象内的小孔或对象上的小黑点时很有用。

closing = cv.morphologyEx(img, cv.MORPH_CLOSE, kernel)

kernel  = (5,5) 

 

 kernel  = (10,10) 

 kernel  = (15,15)  

 

 可以看到,用来进行闭运算的核越大,消除黑色小块的能力越强,不过当核过于大的时候,就是前景与背景的分界变得模糊。

先膨胀后腐蚀 

kernel  = (5,5)  

 

kernel  = (10,10)   

 

kernel  = (15,15)   

 

可以看到,在使用的核相同的情况下,先膨胀后腐蚀,跟闭运算的结果不一样 。

先留着这个问题。

6.形态梯度 

它是图像的膨胀和腐蚀之间的差值。结果将类似于对象的轮廓。、

形态梯度是图像处理中的一种形态学操作,它用于强调图像中的边缘和细节。形态梯度的计算方法是先对图像进行膨胀,然后从膨胀后的图像中减去原始图像。这个操作的结果是一幅图像,其中只包含了原始图像中边缘和显著变化的部分。

形态梯度的计算可以用以下公式表示:

形态梯度(G)=膨胀(f)−腐蚀(f)

其中,f 是原始图像,膨胀(f) 和 腐蚀(f) 分别是图像的膨胀和腐蚀结果。

形态梯度操作可以用于图像分割、特征提取和边缘检测等任务。它对于突出图像中的线状结构和物体的轮廓非常有用。

gradient = cv.morphologyEx(img, cv.MORPH_GRADIENT, kernel)

 

7.顶帽 

它是原图像和原图像开运算结果的差值。

顶帽(Top Hat)变换是图像处理中的一种形态学操作,它用于突出图像中的明亮区域,同时抑制背景。顶帽变换的计算方法是先对图像进行开运算(即先腐蚀后膨胀),然后从原始图像中减去开运算的结果。这个操作的结果是一幅图像,其中只包含了原始图像中比周围区域亮的部分。

顶帽变换的公式可以表示为:

顶帽变换(T)=原始图像(f)−开运算(f)

其中,f 是原始图像,开运算(f) 是图像的开运算结果。

顶帽变换对于提取图像中的小而亮的细节非常有用,这些细节可能在图像的背景或较大物体的遮挡下不明显。

tophat = cv.morphologyEx(img, cv.MORPH_TOPHAT, kernel)

8.黑帽 

黑帽

黑帽(Black Hat)变换是图像处理中的一种形态学操作,它用于突出图像中的暗色区域,同时抑制明亮区域。黑帽变换的计算方法是先对图像进行闭运算(即先膨胀后腐蚀),然后从闭运算的结果中减去原始图像。这个操作的结果是一幅图像,其中只包含了原始图像中比周围区域暗的部分。

黑帽变换的公式可以表示为:

黑帽变换(B)=闭运算(f)−原始图像(f)

其中,f 是原始图像,闭运算(f) 是图像的闭运算结果。

黑帽变换对于提取图像中的小而暗的细节非常有用,这些细节可能在图像的明亮区域或较大物体的遮挡下不明显。

它是原图像和原图像的闭的差值。

blackhat = cv.morphologyEx(img, cv.MORPH_BLACKHAT, kernel)

 

9.结构元素 

在前面的例子中,我们在 numpy 的帮助下手工创建了一个结构参量。它是长方形的。但在某些情况下,您可能需要椭圆/圆形的内核。因此,opencv 有一个函数,**cv.getStructuringElement()**。只要传递内核的形状和大小,就可以得到所需的内核。

 

# Rectangular Kernel
>>> cv.getStructuringElement(cv.MORPH_RECT,(5,5))
array([[1, 1, 1, 1, 1],[1, 1, 1, 1, 1],[1, 1, 1, 1, 1],[1, 1, 1, 1, 1],[1, 1, 1, 1, 1]], dtype=uint8)
# Elliptical Kernel
>>> cv.getStructuringElement(cv.MORPH_ELLIPSE,(5,5))
array([[0, 0, 1, 0, 0],[1, 1, 1, 1, 1],[1, 1, 1, 1, 1],[1, 1, 1, 1, 1],[0, 0, 1, 0, 0]], dtype=uint8)
# Cross-shaped Kernel
>>> cv.getStructuringElement(cv.MORPH_CROSS,(5,5))
array([[0, 0, 1, 0, 0],[0, 0, 1, 0, 0],[1, 1, 1, 1, 1],[0, 0, 1, 0, 0],[0, 0, 1, 0, 0]], dtype=uint8)

http://www.lryc.cn/news/365940.html

相关文章:

  • MFC设置窗口在Z轴上的位置
  • STM32项目分享:智能门禁锁系统
  • PostgreSQL中有没有类似Oracle的dba_objects系统视图
  • 【kubernetes】探索k8s集群的配置资源(secret和configma)
  • 基于springboot实现社区养老服务系统项目【项目源码+论文说明】计算机毕业设计
  • 用linux 1分钟部署一台文件上传/下载的http/https服务器
  • 机器学习ML.NET
  • 爬取基金收盘价并用pyecharts进行展现
  • 各平台对象存储
  • C# 中提取方法进行重构
  • 每天一个数据分析题(三百四十三)
  • 【leetcode--统计优美子数组】
  • 开源模型应用落地-LangChain高阶-LCEL-表达式语言(二)
  • shell脚本对编码和行尾符敏感吗
  • 神经网络----现有网络的下载和使用(vgg16)
  • Java 异常处理 - 自定义异常
  • Excel 交叉表的格转成列,行转成格
  • 【C++软件调试技术】什么是pdb文件?如何使用pdb文件?哪些工具需要使用pdb文件?
  • 如何搭建一台永久运行的个人服务器?
  • Ant Design+react 表单只读
  • 推荐系统三十六式学习笔记:原理篇.近邻推荐07|人以群分,你是什么人就看到什么世界
  • 要改进单例模式的实现以确保线程安全并优化性能,有几种常见的方法
  • k8s——Pod容器中的存储方式及PV、PVC
  • Java/Golang:活用interface,增加程序扩展性
  • SQL语句练习每日5题(四)
  • Java排序算法汇总篇,八种排序算法
  • R语言探索与分析20-北京市气温预测分析
  • 2024年安全现状报告
  • OV通配符ssl证书是什么
  • Selenium三种等待方式的使用!