当前位置: 首页 > news >正文

从像素到频率:OpenCV傅里叶变换

你好!在探索计算机视觉的奇妙世界时,我们已经学会了如何通过直方图来理解图像的像素分布。今天,我们要更近一步,解锁一个能让我们“看穿”图像本质的能力–傅里叶变换。

一、什么是傅里叶变换?

想象一下,你听到一段复杂的交响乐。在我们的耳朵里,它是一个随时间变化的、连续的声音信号。但如果你是一位音乐家,你可能会立刻分辨出其中包含了小提请的高音、大提琴的低音和钢琴的和弦。

傅里叶变换做的就是同样的事情。它能将一个复杂的信号(比如图像)分解成一系列简单的正弦波和余弦波(也就是它的“频率成分”)。

对于图像而言:

  • 空间域 (Spatial Domain) :就是我们通常看到的图像,由一个个像素点排列而成。这就像我们听到的交响乐。
  • 频域 (Frequency Domain) :通过傅里叶变换后得到的世界。它不显示像素的位置,而是显示图像的频率分布。这就像音乐家“看”到的乐谱。

那么,图像的“频率”又是什么呢?

  • 低频成分 (Low Frequencies) :代表图像中灰度变化缓慢、平滑的区域,比如大片的蓝天、平静的湖面或者模糊的背景。它们构成了图像的整体轮廓和结构。
  • 高频成分 (High Frequencies) :代表图像中灰度变化剧烈、尖锐的区域,比如物体的边缘、细节纹理和噪点。

所以,傅里叶变换就像给我们一副特殊的眼镜,让我们从关注“哪里有什么像素”,转变为关注“图像由哪些频率的细节和轮廓构成”。

二、OpenCV实战

在OpenCV中,我们主要使用cv2.dft()cv2.idft()两个函数来进行离散傅里叶变换(DFT)和逆变换。

如下是函数解析:

  • cv2.dft(src, flags=0, nonzeroRows=0)

    • src: 输入图像,必须是 np.float32np.float64 类型。
    • dst: 输出结果。
    • flags: 变换的标志。
      • cv2.DFT_COMPLEX_OUTPUT: 指定输出一个包含实部和虚部的双通道复数数组。
      • cv2.DFT_INVERSE: 用于执行逆变换。
      • cv2.DFT_SCALE: 对结果进行缩放,通常在逆变换时使用,以确保数值范围正确。
  • cv2.idft(src, flags=0, nonzeroRows=0)

    • 这个函数用于将频域图像转换回空间域。 它的参数与dft类似,通常与cv2.DFT_SCALE标志一同使用。

    低通滤波:图像模糊与去噪

低通滤波的目的是保留低频,衰变或去除高频。因为噪声和剧烈的边缘通常是高频信息,所以低通滤波可以实现图像的平滑和去噪。

实现步骤:

  1. 对图像进行傅里叶变换并移位。
  2. 创建一个中心为1(白色),四周为0(黑色)的掩码。这个掩码只允许低频信号通过。
  3. 将掩码与频谱图相乘。
  4. 将结果逆向移位,并执行逆傅里叶变换。
import cv2
import numpy as np
from matplotlib import pyplot as plt# --- 前续步骤同上 ---
img = cv2.imread('your_image.jpg', 0)
img_float32 = np.float32(img)
dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
dft_shift = np.fft.fftshift(dft)# --- 创建低通滤波器掩码 ---
rows, cols = img.shape
crow, ccol = rows // 2 , cols // 2 # 中心点# 设置低通区域大小
mask_size = 30
mask = np.zeros((rows, cols, 2), np.uint8)
mask[crow - mask_size:crow + mask_size, ccol - mask_size:ccol + mask_size] = 1# --- 应用掩码并逆变换 ---
fshift = dft_shift * mask
f_ishift = np.fft.ifftshift(fshift)
img_back = cv2.idft(f_ishift)
img_back = cv2.magnitude(img_back[:,:,0], img_back[:,:,1])# --- 可视化 ---
plt.figure(figsize=(12, 6))
plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(img_back, cmap='gray')
plt.title('Image after LPF'), plt.xticks([]), plt.yticks([])
plt.show()

你会发现,经过低通滤波后,图像变得模糊了,因为细节(高频)被移除了。(你可以用你自己找到图片试试)

高通滤波:边缘检测与锐化

高通滤波与低通滤波相反,它的目标是保留高频,去除低频。这使得它非常适合用来检测物体的边缘。因为边缘一般都是高频信息。

实现起来非常简单,直接将低通滤波的掩码反转即可(中间为0,四周为1)

rows, cols = img.shape
crow, ccol = rows // 2 , cols // 2
mask_size = 30
mask = np.ones((rows, cols, 2), np.uint8) # 先全部置为1
mask[crow - mask_size:crow + mask_size, ccol - mask_size:ccol + mask_size] = 0 # 中心区域置为0

总结

傅里叶变换可以让我们从频率的角度分析图像。频域滤波是一种极其强大的技术,通过设计不同的掩码(如低通、高通),我们可以轻松实现图像去噪、模糊、锐化和边缘检测等多种高级功能。傅里叶变换是图像压缩(如JPEG)、特征提取和更多高级视觉任务的基石。 现在,赶快找几张图片,亲手尝试一下制作自己的滤波器,看看你能从图像的“频率世界”中发现什么新的秘密吧!

http://www.lryc.cn/news/602706.html

相关文章:

  • Java面试宝典:MySQL事务和事务的隔离级别
  • map循环遍历
  • 学习 字节UI TARS GUI Agent
  • 为什么bert是双向transformer
  • 无人机气动设计模块解析
  • html转word下载
  • NVDB-CAVD 杯汽车信息安全系列赛事
  • 基于Java的汽车商城系统设计与实现
  • 汽车膨胀水箱(副水箱)液位传感器的作用
  • 小鹏汽车AI测试
  • stm32开发 -- TFTLCD相关
  • API产品升级丨全知科技发布「知影-API风险监测平台」:以AI重构企业数据接口安全治理新范式
  • JavaWeb 入门:HTML 基础与实战详解(Java 开发者视角)
  • 分数函数的实用性及与数据密度的关系解析
  • ffmpeg-7.1.1 下载安装 windows 版,MP4 转 m3u8 切片,遇到报错 Unrecognized option ‘vbsf‘的解决办法
  • SD卡简介与驱动开发
  • 优测推出HarmonyOS全场景测试服务,解锁分布式场景应用卓越品质!
  • Makefile if语句用法
  • Linux内核驱动开发核心问题全解
  • Python全栈项目--基于深度学习的视频内容分析系统
  • 使用Docker在Rocky Linux 9.5上在线部署LangFlow
  • GoldenDB 分布式数据库详解
  • 在CentOS上以源码编译的方式安装PostgreSQL
  • <七> CentOS 8 安装最新版本Docker
  • 很妙的一道题 Leetcode234. 回文链表
  • 力扣 之 最小覆盖子串(变长滑动窗口,越短越好)
  • 电磁兼容五:仿真技术
  • Mac安装navicat17版本教程mac下载Navicat Premium for Mac v17.1.9【好用】
  • 微算法科技(NASDAQ:MLGO)利用基于区块链的机器学习模型进行交易分类,实现交易数据的匿名化
  • redis数据库的四种取得 shell方法