当前位置: 首页 > article >正文

vrml场景实例代码_Mask TextSpotter v3:用于场景文字检测和识别的分割Proposal网络...

cee0506977c947984d91c8aa894f915e.png

Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting

8302c08a9a6a929cf9d5e88f38bbab48.png
作者团队:华中科大(白翔团队)&Facebook AI
代码:MhLiao/MaskTextSpotterV3
论文:Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting

注:如果上述论文链接无法访问,可以看文末,论文已上传至百度云,方便下载。

表现SOTA!性能优于自家v2、ABCNet、CharNet等网络,代码刚刚开源!

最近的端到端可训练的场景text spotting,集成检测和识别的方法显示出很大的进步。但是,当前大多数任意形状的场景文本 spotters都使用RPN来生成 proposals。

85a021cd7831a96485ec4b6c151aefa3.png

RPN严重依赖手动设计的anchor,其proposals以与轴对齐的矩形表示。前者在处理极高宽高比或不规则形状的文本实例时会遇到困难,而在面向密集文本的情况下,后者通常会在一个proposal中包含多个相邻实例。

为解决这些问题,我们提出了Mask TextSpotter v3,这是一种采用分割proposal网络(SPN)而不是RPN的端到端可训练场景文本观察器。我们的SPN是 anchor-free,可以准确表示任意形状的proposals。因此,它在检测极高宽高比或不规则形状的文本实例方面优于RPN。此外,由SPN生成的准确proposals允许将masked RoI 特征用于解耦相邻的文本实例。因此,我们的Mask TextSpotter v3可以处理具有高长宽比或不规则形状的文本实例,并且其识别精度不会受到附近文本或背景噪声的影响。

3904d1b06da3282b85ce5c6ecf36c06b.png

c70b9fc322227c42775bd2eca1cd9776.png

实验结果

我们在Rotated ICDAR 2013数据集(旋转鲁棒性)上比最新方法高出21.9%,在Total-Text数据集(形状鲁棒性)上比最新技术高出5.9%,并在MSRA-TD500数据集(纵横比的稳健性)。

5e5ed23ddfe99503873131abd366f17e.png

6b65fec33323d45b1a78c0f7e14ffd9a.png

75f459bb33c748b8e519c4d543acfb02.png

f8a8a6c5ec66011044c9c3f91004993c.png

下载

链接: https:// pan.baidu.com/s/19XoFLp uXMSM_dv3ZNuM2gQ
提取码:e43l

强烈推荐大家关注计算机视觉论文速递知乎专栏和CVer微信公众号,可以快速了解到最新优质的CV论文。

推荐阅读

使用深度神经网络从Noisy Labels中学习:全面调研

PyTorch3D:面向3D计算机视觉的PyTorch工具箱

剪枝filter?还是剪枝layer?这是个问题

Facebook发布FAIRScale:用于高性能和大规模训练的PyTorch工具

ECCV 2020 | 53.5 AP!PAA:用于目标检测的IoU预测的概率Anchor分配

ECCV 2020 | DecoupleSegNets:通过解耦的主体和边缘监督改进语义分割

ECCV 2020 Oral | LISRD:局部特征描述符的在线不变性选择

ECCV 2020 | BMask R-CNN:边界保持的Mask R-CNN

ECCV 2020 | 即插即用!PSConv:将特征金字塔压缩到紧凑的多尺度卷积层中

ECCV 2020 | STTN:用于视频修复的时空联合Transformer

ECCV 2020 Oral | DG-Net++:面向跨域的行人重识别新网络

ECCV 2020 | 北邮提出PMG:通过渐进式多粒度拼图训练进行细粒度视觉分类

ECCV 2020 | 通过聚类无标签数据来提高人脸识别能力

http://www.lryc.cn/news/2412839.html

相关文章:

  • Oracle 11g的安装
  • 三十二个vbs整蛊代码,好玩到没朋友
  • WINDOWS无法配置此无线连接,如果您已经启用其他程序管理此无线连接,
  • 鬼哥解说多元链mut背景
  • CEF-概述和常用功能介绍(GeneralUsage翻译)
  • 便利店收银管理系统(源码+开题)
  • 【单片机】51单片机の入门指南上(保姆级)
  • 新建虚拟机向导_老司机教你如何在虚拟机安装win8系统,双系统也可以这样实现...
  • 浙江学计算机怎么选课,新高考下浙江孩子应怎么选课(专业人士建议)
  • 对日外包感悟
  • p2p网络终结者最高权限使用教程
  • 你可能并不知道这样定制炫酷的jupyter主题
  • 【QT教程】QT6 Web开发入门 QT Web
  • WebService接口的生成和调用(WebService接口)
  • #YOLOv7#好用还免费的“赠品”助力实现实时目标检测的新高地
  • ISA Server
  • 2022长安杯的网站重构及部分题解
  • Microsoft程序员测试题(一些高难度智力题)
  • 卷毛机器人抢大龙视频_扫地机器人金榜推荐||扫地机器人近一年低价整理||旗舰扫地机器人最新优惠汇总(20201219)...
  • 单纯的把ASP.NET项目发布到网站上
  • 真人qq秀代码_波士顿动力Spot买家秀
  • jquery 数组indexof_简单谈谈JS数组中的indexOf方法
  • UltraEdit-32的授权码
  • zabbix--监控web服务(2)统计PV和UV
  • 模板代码概述
  • Ubuntu 10.04.4 Server版无线上网相关配置 | (待完善)
  • 周鸿祎做网红的底层逻辑
  • xp每天定时关机命令
  • installshield 脚本 在卸载过程执行_0725-5.16.2-如何卸载CDH5.16.2
  • CCProxy代理上网设置方法