当前位置: 首页 > news >正文

图片增强组件实现

设计并实现了一个图片增强的组件,具体功能如下:

  • 图片数据增强,包括且不限于:图片旋转、比例增强、高斯噪声、饱和度变换等
  • 若图片包含对应标注boundingbox,也支持对应变换,保证圈选内容的不变性
  • 实现多种方式random组合,增加增强效果

具体依赖

import cv2
import numpy as np
import copy
import random
from PIL import Image
import os

数据增强方法

@classmethod
def resize_image(cls, image, mode: str = "img", notes: [[dict]] = None, scale_percent: int = None):if scale_percent is None:scale_percent = random.randrange(30, 80)width = int(image.shape[1] * scale_percent / 100)height = int(image.shape[0] * scale_percent / 100)resized_image = cv2.resize(image, (width, height))if mode == 'notes' and notes is None:raise ValueError("When mode is set to 'notes', you must provide notes data.")elif mode == 'notes':points = [i.get('points') for i in notes]resized_points = []for box in points:resized_box = []for point in box:x = int(point[0] * scale_percent / 100)y = int(point[1] * scale_percent / 100)resized_box.append([x, y])resized_points.append(resized_box)resized_notes = copy.deepcopy(notes)for i in range(len(resized_notes)):resized_notes[i]['points'] = resized_points[i]return resized_image, resized_noteselif mode == 'img':return resized_image
@classmethod
def add_gaussian_noise(cls, image, mode: str = "img", notes: [[dict]] = None, mean=70, std=20):noise = np.random.normal(mean, std, image.shape).astype(np.uint8)noisy_image = cv2.add(image, noise)if mode == 'notes' and notes is None:raise ValueError("When mode is set to 'notes', you must provide notes data.")elif mode == 'notes':gaussian_notes = copy.deepcopy(notes)return noisy_image, gaussian_noteselif mode == 'img':return noisy_image

完整代码

source

http://www.lryc.cn/news/123122.html

相关文章:

  • go.sum are different when using go mod vendor/download
  • Docker技术入门教程
  • Vue2-组件,组件的使用及注意点,组件嵌套,VueComponent构造函数,单文件组件
  • IntelliJ IDEA Bookmark使用
  • kriging-contour前端克里金插值
  • 第八章 CUDA内存应用与性能优化篇(中篇)
  • 适用于物联网 (IoT)的远距离、低功耗、低速率WiFi—Wi-Fi HaLow
  • 【解读Spikingjelly】使用单层全连接SNN识别MNIST
  • 穿越数字奇境:探寻元宇宙中的科技奇迹
  • 2024」预备研究生mem-阴影图形
  • 【设计模式】责任链模式
  • 解密人工智能:线性回归 | 逻辑回归 | SVM
  • 【FFMPEG应用篇】使用FFmpeg的常见问题
  • (vue)获取对象的键遍历,同时循环el-tab页展示key及内容
  • 【严重】Smartbi未授权设置Token回调地址获取管理员权限
  • 北京鸟巢门票多少,里面有什么好玩的
  • 4路光栅尺磁栅尺编码器5MHz高速差分信号转Modbus TCP网络模块 YL97
  • 金蝶云星空对接打通旺店通·企业奇门组装拆卸单查询接口与创建其他出库单接口
  • 卫星--夏令营
  • Kafka的下载安装以及使用
  • 数据库相关面试题
  • Ubuntu常用配置
  • win10MySQLServer安装过程+解决MySQL服务无法启动问题
  • 网络:CISCO、Huawei、H3C命令对照
  • 题目:2319.判断矩阵是否是 X 矩阵
  • 2023年大厂前端面试题汇总
  • 如何在Linux中查找Nginx安装目录
  • 【NLP】训练LLM的不同方式
  • MySQL 45讲笔记(1-10讲)
  • U盘数据如何保密?U盘数据加密软件合集