当前位置: 首页 > news >正文

搭配:基于OpenCV的边缘检测实战

引言

计算机中的目标检测与人类识别物体的方式相似。作为人类,我们可以分辨出狗的形象,因为狗的特征是独特的。尾巴、形状、鼻子、舌头等特征综合在一起,帮助我们把狗和牛区分开来。

同样,计算机能够通过检测与估计物体的结构和性质相关的特征来识别物体。其中一个特征就是边缘。

在数学上,边是两个角或面之间的一条线。边缘检测的关键思想是像素亮度差异极大的区域表示边缘。因此,边缘检测是对图像亮度不连续性的一种度量。

Sobel边缘检测

Sobel边缘检测器也称为Sobel–Feldman运算符或Sobel过滤器,它的工作原理是通过计算图像中每个像素的图像强度梯度。

它找到了从亮到暗的最大亮度增加方向以及该方向的变化率。使用该过滤器时,可以分别在X和Y方向上或一起处理图像。

1a1d7bff7d9c77a1ad49c8732e167cd0.png

Sobel检测器使用3X3核函数,这些核函数与原始图像进行卷积,计算出导数的近似值。

为了检测图像中的水平边缘(x方向) ,我们将使用x方向内核来扫描图像,用于检测垂直边缘。

import cv2
import numpy as np
import matplotlib.pyplot as plt
# Load the image
image_original = cv2.imread('building.jpg', cv2.IMREAD_COLOR)
# Convert image to gray scale
image_gray = cv2.cvtColor(image_original, cv2.COLOR_BGR2GRAY)
# 3x3 Y-direction  kernel
sobel_y = np.array([[-1, -2, -1], [0, 0, 0], [1, 2, 1]])
# 3 X 3 X-direction kernel
sobel_x = np.array([[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]])
# Filter the image using filter2D, which has inputs: (grayscale image, bit-depth, kernel)
filtered_image_y = cv2.filter2D(image_gray, -1, sobel_y)
filtered_image_x = cv2.filter2D(image_gray, -1, sobel_x)

现在,让我们绘制上面代码的输出。

(fig, (ax1, ax2, ax3)) = plt.subplots(1, 3, figsize=(25, 25))
ax1.title.set_text('Original Image')
ax1.imshow(image_original)
ax2.title.set_text('sobel_x')
ax2.imshow(filtered_image_y)
ax3.title.set_text('sobel_y filter')
ax3.imshow(filtered_image_x)
plt.show()

33c1fad402ed9d42ea870f85573e4dbd.png

不需要记住所有的过滤器内核。可以直接在 OpenCV 库中使用您选择的相应过滤器。

在OpenCV中,可以像如下所示应用Sobel边缘检测。

sobel_x_filtered_image = cv2.Sobel(image_gray, cv2.CV_64F, 1, 0, ksize=3)
sobel_x_filtered_image = cv2.Sobel(image_gray, cv2.CV_64F, 0, 1, ksize=3)
sobel_y_filtered_image = cv2.convertScaleAbs(sobel_x_filtered_image)
sobel_y_filtered_image = cv2.convertScaleAbs(sobel_y_filtered_image)

Laplacian边缘检测

拉普拉斯边缘检测器比较图像的二阶导数。它测量的是一阶导数在一次通过中的变化率。拉普拉斯边缘检测使用一个核心,包含负值的交叉模式,如下所示。

535b00be8f065ebe6b677b9c951666ea.png

拉普拉斯边缘检测器的一个缺点是对噪声敏感。也就是说,它可能最终检测噪声作为边缘。在应用拉普拉斯过滤器之前对图像进行平滑处理是一种常见的做法。

我们可以实现一个拉普拉斯边缘检测器如下:

import cv2
import numpy as np
import matplotlib.pyplot as plt
image_original = cv2.imread('building.jpg', cv2.IMREAD_COLOR)
# remove noise
image_gray = cv2.cvtColor(image_original, cv2.COLOR_BGR2GRAY)
# Reduce noise in image
img = cv2.GaussianBlur(image_gray,(3,3),0)
# Filter the image using filter2D, which has inputs: (grayscale image, bit-depth, kernel)
filtered_image = cv2.Laplacian(img, ksize=3, ddepth=cv2.CV_16S)
# converting back to uint8
filtered_image = cv2.convertScaleAbs(filtered_image)
# Plot outputs
(fig, (ax1, ax2)) = plt.subplots(1, 2, figsize=(15, 15))
ax1.title.set_text('Original Image')
ax1.imshow(image_original)
ax2.title.set_text('Laplacian Filtered Image')
ax2.imshow(filtered_image, cmap='gray')

05f356387c2adf660bbb52af98d72f03.png

Canny边缘检测

Canny边缘检测可以分为如下四个步骤:

· 消除噪音

· 梯度计算

· 利用非最大值抑制提取图像边缘

· 滞后阈值法

因为Canny边缘检测对噪声很敏感,所以第一步就是去噪,通过首先应用高斯滤波器对图像进行平滑处理。

Canny边缘检测的第二步是梯度计算。它通过沿着梯度方向计算图像中灰度(梯度)的变化率来实现。

我们知道图像的亮度在边缘处最高,但实际上,亮度并不是在一个像素处达到峰值; 相反,邻近的像素具有很高的亮度。在每个像素位置,canny 边缘检测比较像素,并在沿梯度方向选择3X3邻域的局部最大值。这个过程被称为非最大值抑制。

这一步结束之后,会形成一些破碎的边缘。最后一步是使用一种叫做滞后阈值的方法来修复这些断裂的边缘。

对于滞后阈值,有两个阈值: 高阈值和低阈值。

任何梯度值高于高阈值的像素自动保持为边缘。对于梯度位于高阈值和低阈值之间的像素,有两种处理方式。检查像素是否可能连接到边缘; 如果连接,则保留像素,否则丢弃。低于低阈值的像素被自动丢弃。

现在,让我们通过OpenCV实现一个Canny边缘检测。

import cv2
import numpy as np
import matplotlib.pyplot as plt
image_original = cv2.imread('building.jpg', cv2.IMREAD_COLOR)
# remove noise
image_gray = cv2.cvtColor(image_original, cv2.COLOR_BGR2GRAY)
filtered_image = cv2.Canny(image_gray, threshold1=20, threshold2=200)
# Plot outputs
(fig, (ax1, ax2)) = plt.subplots(1, 2, figsize=(15, 15))
ax1.title.set_text('Original Image')
ax1.imshow(image_original)
ax2.title.set_text('Laplacian Filtered Image')
ax2.imshow(filtered_image, cmap='gray')

c161cf4c93f1fd5bc4ec9af3d08e64ec.png

·  END  ·

HAPPY LIFE

8cce092d8ed4e47d3e9c4f126c0aded0.png

觉得有趣就点亮在看吧

dbb4a6abd03b5fccdad69b3a883b5c5a.gif

http://www.lryc.cn/news/241480.html

相关文章:

  • AI大发展:人机交互、智能生活全解析
  • Django DRF序列化器serializer
  • 【开源】基于JAVA的衣物搭配系统
  • Spark---基于Standalone模式提交任务
  • webrtc的RTCPeerConnection使用
  • 【视觉SLAM十四讲学习笔记】第三讲——Eigen库
  • Ubuntu开机显示recovering journal,进入emergency mode
  • C++_String增删查改模拟实现
  • LeeCode前端算法基础100题(2)- 最多水的容器
  • 排序算法--归并排序
  • 【LeetCode:1410. HTML 实体解析器 | 模拟+哈希表+字符串+库函数】
  • 基于SSM的公司仓库管理系统(有报告)。Javaee项目
  • spark数据倾斜的解决思路
  • Python武器库开发-前端篇之html概述(二十八)
  • 安防视频EasyCVR平台太阳能供电+4G摄像头视频监控方案的建设
  • 12.位运算的性质(异或的性质)
  • 国标直流充电枪9孔分别啥意思?
  • 关于 Google AMP 和 SEO
  • 【SpringMVC】 对请求的不同响应
  • SQL进阶学习
  • 邦芒解析:做好职场规划防止跳槽失败
  • 基于springboot实现实习管理系统的设计与实现项目【项目源码+论文说明】计算机毕业设计
  • 【华为OD题库-031】比赛的冠亚季军-java
  • 电脑如何禁止截屏
  • 【Web】NewStarCTF Week1 个人复现
  • Android 提示框代码 java语言
  • 【c语言】二维数组的对角线对称交换
  • Sulfo-CY3 NHS荧光染料的制备和表征
  • 数字乡村:科技赋能农村产业升级
  • K8S部署mongodb-sharded-cluster(7.0.2)副本分片