当前位置：首页 > news >正文

Real-time Scene Text Detection with Differentiable Binarization

news 2025/7/7 19:06:52

Abstract

近年来，基于分割的方法在文本检测场景中非常流行，因为分割结果可以更准确地描述曲线文本等各种形状的场景文本。然而，二值化的后处理对于分割检测是必不可少的，它将分割方法产生的概率图转换为文本框/区域。本文提出了一个可微二值化(DB)模块，该模块可以在分割网络中进行二值化处理。与DB模块一起优化的分割网络可以自适应地设置二值化的阈值，不仅简化了后处理，而且提高了文本检测的性能。基于一个简单的分割网络，我们在5个基准数据集上验证了DB模块的性能，在检测精度和效率方面都始终达到了sota结果。特别是，使用轻量级结构，DB的性能提高是显著的，因此我们可以在检测精度和效率之间找到一个平衡。具体来说，以ResNet-18为backbone网络，我们的检测器在MSRA-TD500数据集上实现了82.8的f值，以62FPS/秒的速度运行。
代码已开源：https://github.com/MhLiao/DB。

Introduction

Methodology

Binarization

Adaptive threshold

Deformable convolution

Label generation

Optimization

Experiments Datasets

Implementation details

Ablation study

Comparisons with previous methods

Limitation

Conclusion

http://www.lryc.cn/news/5153.html

相关文章：

国外客户只想跟工厂合作？可以这样破解

c++重中之重：“换个龟壳继续套娃“：运算符重载等的学习

RabbitMQ简单使用

Lambda表达式

JSON数据格式【学习记录】

LeetCode——1234. 替换子串得到平衡字符串

Web自动化测试——selenium篇(二)

RK3399平台开发系列讲解（文件系统篇）虚拟文件系统的数据结构

企业财务管理升级，智慧税务和数据可视化打造新标准

JFET(结型场效应管)

oceanbase部署--使用OBD部署obagent和promethous_grafana软件

浏览器广告拦截插件| 浏览器搜索广告横飞怎么办

Redis优化内存篇

Vue原理解析

C# Lambda表达式含义及各种写法

计算机组成原理：1. 计算机系统概论

【c#】c#常用小技巧方法整理（5）—— 字符串操作类

用队列实现栈VS用栈实现队列

MY2480-16P语音模块的使用

I/O 多路复用

2023 最新版网络安全保姆级指南，从0到1，建议收藏！

力扣39.组合总数

sql的case when用法详解

AtCoder Grand Contest 061（题解）

生成系列论文：文本控制的3d点云生成 TextCraft（一）：论文概览

IDEA常用插件

Spring的事务传播机制

Python:路径之谜（DFS剪枝)

阿里巴巴在开源压测工具 JMeter 上的实践和优化

React Draggable插件实现拖拽功能