当前位置: 首页 > news >正文

Real-time Scene Text Detection with Differentiable Binarization

Abstract

近年来,基于分割的方法在文本检测场景中非常流行,因为分割结果可以更准确地描述曲线文本等各种形状的场景文本。然而,二值化的后处理对于分割检测是必不可少的,它将分割方法产生的概率图转换为文本框/区域。本文提出了一个可微二值化(DB)模块,该模块可以在分割网络中进行二值化处理。与DB模块一起优化的分割网络可以自适应地设置二值化的阈值,不仅简化了后处理,而且提高了文本检测的性能。基于一个简单的分割网络,我们在5个基准数据集上验证了DB模块的性能,在检测精度和效率方面都始终达到了sota结果。特别是,使用轻量级结构,DB的性能提高是显著的,因此我们可以在检测精度和效率之间找到一个平衡。具体来说,以ResNet-18为backbone网络,我们的检测器在MSRA-TD500数据集上实现了82.8的f值,以62FPS/秒的速度运行。
代码已开源 :https://github.com/MhLiao/DB。

Introduction

Methodology

Binarization

Adaptive threshold

Deformable convolution

Label generation

Optimization

Experiments Datasets

Implementation details

Ablation study

Comparisons with previous methods

Limitation

Conclusion

http://www.lryc.cn/news/5153.html

相关文章:

  • 国外客户只想跟工厂合作?可以这样破解
  • c++重中之重:“换个龟壳继续套娃“:运算符重载等的学习
  • RabbitMQ简单使用
  • Lambda表达式
  • JSON数据格式【学习记录】
  • LeetCode——1234. 替换子串得到平衡字符串
  • Web自动化测试——selenium篇(二)
  • RK3399平台开发系列讲解(文件系统篇)虚拟文件系统的数据结构
  • 企业财务管理升级,智慧税务和数据可视化打造新标准
  • JFET(结型场效应管)
  • oceanbase部署--使用OBD部署obagent和promethous_grafana软件
  • 浏览器广告拦截插件| 浏览器搜索广告横飞怎么办
  • Redis优化内存篇
  • Vue原理解析
  • C# Lambda表达式含义及各种写法
  • 计算机组成原理:1. 计算机系统概论
  • 【c#】c#常用小技巧方法整理(5)—— 字符串操作类
  • 用队列实现栈VS用栈实现队列
  • MY2480-16P语音模块的使用
  • I/O 多路复用
  • 2023 最新版网络安全保姆级指南,从0到1,建议收藏!
  • 力扣39.组合总数
  • sql的case when用法详解
  • AtCoder Grand Contest 061(题解)
  • 生成系列论文:文本控制的3d点云生成 TextCraft(一):论文概览
  • IDEA常用插件
  • Spring的事务传播机制
  • Python:路径之谜(DFS剪枝)
  • 阿里巴巴在开源压测工具 JMeter 上的实践和优化
  • React Draggable插件实现拖拽功能