当前位置: 首页 > news >正文

基于paddleocr的文档识别

1、版面分析

使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。

数据集:

英文:publaynet数据集的训练集合中包含35万张图像,验证集合中包含1.1万张图像。总共包含5个类别。

中文:CDLA据集的训练集合中包含5000张图像,验证集合中包含1000张图像

2、文本分析

文本检测:改进了基于分割的DBNet (Differentiable Binarization)

数据集:ICDAR 2015 数据集包含1000张训练图像和500张测试图像。

文本识别:SVTR_LCNet(将基于Transformer的SVTR网络和轻量级CNN网络PP-LCNet 融合的一种轻量级文本识别网络)

数据集:

 

 3、表格

1. 文字检测模型:用于检测表格里的文本

2. 文字识别模型:用于对检测到的文本进行识别

3. SLANet模型用于预测表格结构的HTML信息和表格单元格坐标

 

数据集:

PubTabNet数据集的训练集合中包含50万张图像,验证集合中包含0.9万张图像

好未来表格识别竞赛数据集的训练集合中包含1.6万张图像。验证集未给出可训练的标注。

参考来源: GitHub - PaddlePaddle/PaddleOCRicon-default.png?t=N6B9https://github.com/PaddlePaddle/PaddleOCR

http://www.lryc.cn/news/137162.html

相关文章:

  • 魏副业而战:闲鱼卖货赚钱策略
  • 语法篇--XML数据传输格式
  • 【Redis】缓存雪崩、缓存击穿、缓存穿透
  • 通过示例学习 JavaScript 运算符 - 逻辑、比较、三元和更多 JS 运算符
  • 基于微信小程序+Springboot校园二手商城系统设计和实现
  • excel 动态表头与合并列
  • jenkins自动部署微服务到docker
  • 【蔚来汽车】蔚来20220713第三题-旅游规划 <模拟、滑动窗口>
  • [解决方案]Antd TreeSelect/Select placeholder失效
  • 微人事 部门管理 模块 (十五)
  • 【Terraform学习】使用 Terraform 从 EC2 实例访问 S3 存储桶(Terraform-AWS最佳实战学习)
  • ZDRE6VP4-1X/50MG24K4V比例压力阀放大器
  • 纠缠辅助的量子网络:原理、技术、发展与挑战
  • React Native 可触摸组件基础知识
  • 用户、权限和Vim编辑器
  • git版本管理加合并笔记
  • Failed to load property source from location ‘classpath:/application.yml‘
  • Ajax复习
  • 里式替换原则(LSP)
  • mysql------做主从复制,读写分离
  • Anaconda虚拟环境跨系统迁移
  • 第四章 IRIS 编程简介 - Macros
  • 大厂考核重点:mysql索引面试题
  • MySQL使用binlog日志做数据恢复
  • USB Type-C端口集成式ESD静电保护方案 安全低成本
  • Shiro学习总结
  • AS中回退git历史版本并删除历史提交记录
  • 线性代数的学习和整理5: 矩阵的加减乘除及其几何意义
  • sqlsugar 使用TNS连接oracle
  • 用python解压zip文件