当前位置: 首页 > news >正文

[C#]基于deskew算法实现图像文本倾斜校正

【算法介绍】

让我们开始讨论Deskeweing算法的一般概念。我们的主要目标是将旋转的图像分成文本块,并确定它们的角度。为了让您详细了解我将使用的方法:

如何使用OpenCV自动校正文本图像

  1. 照常-将图像转换为灰度。
  2. 应用轻微的模糊以减少图像中的噪点。
  3. 现在,我们的目标是找到带有文本的区域,即图像的文本块。为了使文本块检测更容易,我们将反转并最大化图像的颜色,这将通过阈值化来实现。因此,现在文本变为白色(恰好为255,255,255白色),而背景为黑色(同样为0,0,0黑色)。
  4. 要查找文本块,我们需要合并该块的所有打印字符。我们通过膨胀(扩展白色像素)来实现。在X轴上使用较大的内核可以消除单词之间的所有空间,而在Y轴上使用较小的内核可以将彼此之间的一个块的行混合在一起,但保持文本块之间的较大间隔不变。
  5. 现在,用最小面积矩形包围轮廓的简单轮廓检测将形成我们需要的所有文本块。
  6. 确定倾斜角度的方法有很多种,但我们将坚持简单的方法-使用最大的文本块并使用其角度。

【效果展示】


【实现部分代码】

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Diagnostics;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;namespace FIRC
{public partial class Form1 : Form{Bitmap src = null;public Form1(){InitializeComponent();}private void button1_Click(object sender, EventArgs e){OpenFileDialog openFileDialog = new OpenFileDialog();openFileDialog.Filter = "图文件(*.*)|*.jpg;*.png;*.jpeg;*.bmp";openFileDialog.RestoreDirectory = true;openFileDialog.Multiselect = false;if (openFileDialog.ShowDialog() == DialogResult.OK){src = new Bitmap(openFileDialog.FileName);pictureBox1.Image = src;}}private void button2_Click(object sender, EventArgs e){if(pictureBox1.Image==null){return;}Stopwatch sw = new Stopwatch();sw.Start();var gd = new gmseDeskew(src);var angle = gd.GetSkewAngle();var resultImage = gmseDeskew.RotateImage(src, angle);sw.Stop();this.Text = "耗时" + sw.Elapsed.TotalSeconds + "秒";pictureBox2.Image = resultImage;}private void Form1_Load(object sender, EventArgs e){}private void btn_video_Click(object sender, EventArgs e){}}
}


【视频演示】

bilibili.com/video/BV1x94y1g7uT
【源码下载】

https://download.csdn.net/download/FL1623863129/88694134
【测试环境】

VS2019

netframework4.7.2(支持netframwork2.0以上都可以)
【参考文献】

[1] guanshanw.com/post/30887.html

http://www.lryc.cn/news/272760.html

相关文章:

  • Qt通过pos()获取坐标信息
  • 【Webpack】资源输入输出 - 配置资源出口
  • 【XR806开发板试用】XR806串口驱动CM32M对小厨宝的控制实验
  • 中介者模式-Mediator Pattern-1
  • ASP.NET Core基础之图片文件(一)-WebApi图片文件上传到文件夹
  • 精准掌控 Git 忽略规则:定制化 .gitignore 指南
  • Harmony 开始支持 Flutter ,聊聊 Harmony 和 Flutter 之间的因果
  • k8s 之7大CNI 网络插件
  • stable diffusion 人物高级提示词(一)头部篇
  • 限制哪些IP能连接postgre
  • 可狱可囚的爬虫系列课程 08:新闻数据爬取实战
  • mysql2pgsql
  • 设计模式-流接口模式
  • Java 堆与栈的作用与区别
  • 再谈小米汽车
  • Power Apps 学习笔记 - IOrganizationService Interface
  • 常见函数的4种类型(js的问题)
  • DNS主从服务器、转发(缓存)服务器
  • 第二十一章 网络编程
  • scratch新跳7游戏 2023年12月中国电子学会图形化编程 少儿编程 scratch编程等级考试四级真题和答案解析
  • 三、C#面向对象编程(接口与实现)
  • 【java爬虫】股票数据获取工具前后端代码
  • Scikit-Learn线性回归(四)
  • SCT2330C——3.8V-28V输入,3A,低EMI,超低功耗同步降压DCDC转换器
  • php生成唯一ID的5种方法介绍
  • 向日葵远程工具安装Mysql的安装与配置
  • Unity 欧盟UMP用户隐私协议Android接入指南
  • AutoLisp入门教程
  • matplotlib颜色合集——各种常见简单图形(上)
  • 小H靶场笔记:DC-3