当前位置: 首页 > news >正文

计算机视觉8 图像增广

图像增广(image augmentation)是通过对训练图像进行一系列随机改变,从而产生相似但又不同的训练样本的技术。

图像增广有以下两个主要作用:

  1. 扩大训练数据集的规模;
  2. 随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。

例如,通过不同方式裁剪图像,使感兴趣的物体出现在不同位置,可以减轻模型对物体出现位置的依赖性;调整亮度、色彩等因素能降低模型对色彩的敏感度。

一些常见的图像增广方法包括:

  1. 翻转:如左右翻转(通过torchvision.transforms.RandomHorizontalFliptf.image.random_flip_left_right实现)和上下翻转(通过torchvision.transforms.RandomVerticalFliptf.image.random_flip_up_down实现),通常不会改变对象的类别。
  2. 随机裁剪:随机裁剪一个面积为原始面积一定比例(如10%到100%)的区域,该区域的宽高比也在一定范围内随机取值(如0.5到2),然后将该区域的宽度和高度缩放到指定像素(如200像素)。例如,使用torchvision.transforms.RandomResizedCroptf.image.random_crop
  3. 亮度变化:将图像的亮度随机调整为原图亮度的一定比例范围(如50%到150%),可通过torchvision.transforms.ColorJitter中的brightness参数或tf.image.random_brightness实现。
  4. 色调变化:随机更改图像的色调,如使用torchvision.transforms.ColorJitter中的hue参数或tf.image.random_hue
  5. 颜色变化:还可以同时随机更改图像的亮度、对比度、饱和度和色调,创建torchvision.transforms.ColorJitter实例并设置相应参数即可。
  6. 组合多种方法:可以使用torchvision.transforms.Compose将多个图像增广方法组合起来应用到图像上。

在实践中,通常仅在训练样本上进行图像增广,而在预测过程中不使用随机操作的图像增广,以获得确切的结果。

http://www.lryc.cn/news/402565.html

相关文章:

  • Transformer中的自注意力是怎么实现的?
  • LabVIEW鼠标悬停在波形图上的曲线来自动显示相应点的坐标
  • 操作系统发展简史(Unix/Linux 篇 + DOS/Windows 篇)+ Mac 与 Microsoft 之风云争霸
  • 钡铼分布式 IO 系统 OPC UA边缘计算耦合器BL205
  • 实现了一个心理测试的小程序,微信小程序学习使用问题总结
  • vue是如何进行监听数据变化的?vue2和vue3分别是什么?vue3为什么要更换?
  • 数据结构day3
  • 免费的数字孪生平台助力产业创新,让新质生产力概念有据可依
  • mtsys2 编译 qemu 记录
  • 【Python数据分析】数据分析三剑客:NumPy、SciPy、Matplotlib中常用操作汇总
  • STM32智能家居电力管理系统教程
  • C# 邮件发送
  • Kotlin 协程简化回调
  • 帝王蝶算法(EBOA)及Python和MATLAB实现
  • 【学术会议征稿】第六届信息与计算机前沿技术国际学术会议(ICFTIC 2024)
  • PHP MySQL 读取数据
  • 点亮 LED-I.MX6U嵌入式Linux C应用编程学习笔记基于正点原子阿尔法开发板
  • 从0到1搭建数据中台(4):neo4j初识及安装使用
  • 【20】读感 - 架构整洁之道(二)
  • js vue axios post 数组请求参数获取转换, 后端go参数解析(gin框架)全流程示例
  • 揭秘郭采洁浪漫升级
  • 数据结构(Java):力扣牛客 二叉树面试OJ题(一)
  • 在国产芯片上实现YOLOv5/v8图像AI识别-【1.3】YOLOv5的介绍及使用(训练、导出)更多内容见视频
  • 逻辑门的题目怎么做?
  • CentOS 7报错:yum命令报错 “ Cannot find a valid baseurl for repo: base/7/x86_6 ”
  • 51单片机STC89C52RC——18.1 HC-SR04超声波测距
  • WordPress与 wp-cron.php
  • bb-------
  • 数据挖掘与分析部分实验与实训项目报告
  • Python中使用SpeechLib实现文本转换语音朗读的示例(修正bug)