当前位置: 首页 > news >正文

机器学习笔记 - Ocr识别中的文本检测EAST网络概述

一、文本检测

        文本检测简单来说就是找到图像中可以出现文本的区域。例如,请参见下图,其中在检测到的文本周围绘制了绿色边框。

        在进行文本检测时,你可能会遇到两种情况

  • 具有结构化文本的图像:这是指具有干净/均匀背景和常规字体的图像。文本大多密集,行结构正确,文本颜色均匀。

  • 带有非结构化文本的图像:这是指复杂背景上带有稀疏文本的图像。文本可以具有不同的颜色、大小、字体和方向,并且可以出现在图像中的任何位置。对这些图像执行文本检测称为场景文本检测。

        上述两种情况中哪一种看起来更具挑战性。显然,由于如上所述的各种复杂性,答案将是场景文本检测。这就是为什么这是计算机视觉领域的一个活跃研究课题。

1、文本检测器(EAST)

        在文本检测领域引入深度学习之前,大多数文本分割方法很难在具有挑战性的场景中执行。传统方法使用手动设计的特

http://www.lryc.cn/news/235057.html

相关文章:

  • 【SQL server】数据库、数据表的创建
  • vue的生命周期分别是什么?
  • Java拼图游戏
  • Vue框架的element组件table文字居中
  • 科技创新 共铸典范 | 江西卫健办邓敏、飞图影像董事长洪诗诗一行到访拓世科技集团,提振公共卫生事业发展
  • Linux安装OpenCV并配置VSCode环境
  • Django(ORM事务操作|ORM常见字段类型|ORM常见字段参数|关系字段|Meta元信息)
  • 【mujoco】Ubuntu20.04配置mujoco210
  • 【洛谷 P3853】[TJOI2007] 路标设置 题解(二分答案+循环)
  • 蓝桥杯 vector
  • ai绘画部署教程
  • 策略模式的应用——应对频繁的需求变更
  • qt-C++笔记之treeWidget初次使用
  • SQL零基础入门教程,贼拉详细!贼拉简单! 速通数据库期末考!(八)
  • C语言编程陷阱(八)
  • 客户端性能优化实践
  • mysql使用--表达式和函数
  • <蓝桥杯软件赛>零基础备赛20周--第6周--数组和队列
  • 软件开发、网络空间安全、人工智能三个方向的就业和前景怎么样?哪个方向更值得学习?
  • 新增文章分类
  • 选硬币该用动态规划
  • LeetCode 2342. 数位和相等数对的最大和:哈希表
  • Vulkan渲染引擎开发教程 一、开发环境搭建
  • (带教程)商业版SEO关键词按天计费系统:关键词排名优化、代理服务、手机自适应及搭建教程
  • IDEA 快捷键汇总
  • 目标检测YOLO实战应用案例100讲-基于机器视觉的水稻病虫害监测预警
  • OrthoNets:正交信道注意网络
  • C_12练习题
  • 导航守卫有哪三种?
  • 强烈 推荐 13 个 Web前端在线代码IDE