当前位置: 首页 > news >正文

Haar cascade训练人脸小模型做人脸辨别

代码讲解

1. 导入必要的库
import cv2
import os
from pathlib import Path
import shutil
import numpy as np
import logging
  • cv2: OpenCV 库,用于图像处理和计算机视觉。
  • os: 提供了一种便携的方式使用操作系统依赖的功能。
  • pathlib.Path: 提供了对象导向的路径处理方法。
  • shutil: 提供了高级文件操作,如复制、移动文件等。
  • numpy: 用于处理数组和矩阵的计算。
  • logging: 提供了记录日志的功能。
2. 设置日志
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

设置日志的基本配置,使得程序可以记录信息级别的日志。

3. 加载 Haar cascade 模型
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')

加载 OpenCV 预训练的 Haar cascade 分类器,用于检测图像中的人脸。

4. 定义文件夹
REFERENCE_DIR = "reference"
NO_MATCH_DIR = "no_match"
os.makedirs(REFERENCE_DIR, exist_ok=True)
os.makedirs(NO_MATCH_DIR, exist_ok=True)

定义参考图像文件夹和不匹配图像的存放文件夹,并确保这些文件夹存在。

5. 加载训练数据集
training_data = []
labels = []def load_training_data(training_dir):label = 0  # 假设只有一个参考人物for root, _, files in os.walk(training_dir):for file in files:if file.endswith(".jpg") or file.endswith(".png"):path = os.path.join(root, file)image = cv2.imread(path, cv2.IMREAD_GRAYSCALE)  # 直接读取为灰度图if image is not None:training_data.append(image)labels.append(label)

遍历指定的训练数据文件夹,加载所有 .jpg.png 图片,并将它们转换为灰度图存储在 training_data 列表中,标签统一为 0(假设只有一个参考人物)。

6. 训练人脸识别器
def train_recognizer(training_data, labels):recognizer = cv2.face.LBPHFaceRecognizer_create()recognizer.train(training_data, np.array(labels))return recognizer

使用 Local Binary Patterns Histograms (LBPH) 方法训练人脸识别器。

7. 检测图像中的人脸
def detect_faces(image):gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)face_rects = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))return face_rects

检测传入图像中的人脸位置,并返回人脸矩形框。

8. 识别图像中的人脸
def recognize_face(recognizer, image):gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 确保图像为灰度图face_rects = detect_faces(image)if len(face_rects) > 0:for (x, y, w, h) in face_rects:roi_gray = gray[y:y+h, x:x+w]  # 使用灰度图label, confidence = recognizer.predict(roi_gray)return label, confidencereturn None, None

使用训练好的人脸识别器来识别图像中的人脸,并返回标签和置信度。

9. 处理单张图片
def process_image(png_file, recognizer, threshold=100):try:image = cv2.imread(str(png_file))if image is None:raise FileNotFoundError(f"Could not load image from {png_file}")label, confidence = recognize_face(recognizer, image)if label is not None and confidence < threshold:logging.info(f"{png_file.name} belongs to the target person.")else:logging.info(f"{png_file.name} does not belong to the target person.")destination = Path(NO_MATCH_DIR) / png_file.nameshutil.move(str(png_file), str(destination))  # 移动不匹配的图片except Exception as e:logging.error(f"Error processing {png_file.name}: {str(e)}")

处理单张图片,识别其中的人脸,如果识别结果的置信度低于阈值,则移动该图片到 NO_MATCH_DIR 文件夹。

10. 处理文件夹中的所有 .png 图片
def process_images(directory, recognizer):directory_path = Path(directory)png_files = list(directory_path.glob('*.png'))for png_file in png_files:process_image(png_file, recognizer)

遍历指定目录下的所有 .png 文件,并逐一处理。

11. 主程序入口
if __name__ == "__main__":# 加载训练数据集load_training_data(REFERENCE_DIR)# 训练人脸识别器recognizer = train_recognizer(training_data, labels)# 处理目标文件夹中的图片input_directory = 'images'  # 请确保这个路径是正确的process_images(input_directory, recognizer)

主程序入口,加载训练数据集,训练人脸识别器,并处理指定目录下的所有图片。

总结

这段代码实现了从一个包含参考人物的图像文件夹中加载数据,训练一个简单的人脸识别器,然后用这个识别器去识别另一个文件夹中的图片,并将不匹配的图片移动到另一个文件夹中。通过这种方式,可以有效地对大量图片进行分类处理。

http://www.lryc.cn/news/458934.html

相关文章:

  • DBA | 如何将 .mdf 与 .ldf 的数据库文件导入到SQL Server 数据库中?
  • 【差分数组】个人练习-Leetcode-3229. Minimum Operations to Make Array Equal to Target
  • HTML5--裸体回顾
  • 【网络安全】CVE-2024-46990: Directus环回IP过滤器绕过实现SSRF
  • 问:JVM的垃圾收集算法你知道哪些,有什么区别?
  • Python selenium库学习使用实操四
  • 用Go开发跨平台GUI
  • 云原生开发 - 工具镜像(简约版)
  • Mac 电脑pink 后端ip地址进行本地联调
  • iPhone使用指南:如何在没有备份的情况下从 iPhone 恢复已删除的照片
  • 黑马程序员 javaWeb基础学习,精细点复习【持续更新】
  • 【C++设计模式】行为型模式:中介者模式
  • 关于C语⾔内存函数 memcpy memmove memset memcmp
  • 华为---Super VLAN简介及示例配置
  • PHP 中浮点数 array_sum 求和精度丢失问题
  • llava1.5论文阅读
  • 【学术会议投稿链接】React前端框架:构建现代Web应用的强大工具
  • Linux: network: tcp: sk_tx_skb_cache;4.18.0-283.el8;多分配内存
  • 电脑报错msvcp100.dll丢失怎么办?这些方法快速修复
  • pymc的安装还是pymc3?
  • 汉语言文学做大数据七年实际工作经验分享普通人快来围观
  • Linux使用Docker部署Paperless-ngx结合内网穿透打造无纸化远程办公
  • PointNet系列论文阅读与理解
  • 反转链表解题思路
  • 【MySQL 保姆级教学】数据库基础(重点)(2)
  • Nginx从入门到实战(八):版本平滑无感知,不停机升级
  • jQuery 用户登录页面非空校验与登录测试
  • 《Linux从小白到高手》综合应用篇:深入理解Linux进程调优
  • Linux安装elasticsearch单机版
  • el-table表头加红色星标