当前位置：首页 > news >正文

基于paddleocr的文档识别

news 2025/8/11 23:04:34

1、版面分析

使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。

数据集：

英文：publaynet数据集的训练集合中包含35万张图像，验证集合中包含1.1万张图像。总共包含5个类别。

中文：CDLA据集的训练集合中包含5000张图像，验证集合中包含1000张图像

2、文本分析

文本检测：改进了基于分割的DBNet (Differentiable Binarization)

数据集：ICDAR 2015 数据集包含1000张训练图像和500张测试图像。

文本识别：SVTR_LCNet（将基于Transformer的SVTR网络和轻量级CNN网络PP-LCNet 融合的一种轻量级文本识别网络）

数据集：

3、表格

1. 文字检测模型：用于检测表格里的文本

2. 文字识别模型：用于对检测到的文本进行识别

3. SLANet模型用于预测表格结构的HTML信息和表格单元格坐标

数据集：

PubTabNet数据集的训练集合中包含50万张图像，验证集合中包含0.9万张图像

好未来表格识别竞赛数据集的训练集合中包含1.6万张图像。验证集未给出可训练的标注。

参考来源： GitHub - PaddlePaddle/PaddleOCRhttps://github.com/PaddlePaddle/PaddleOCR

查看全文

http://www.lryc.cn/news/137162.html

魏副业而战：闲鱼卖货赚钱策略

语法篇--XML数据传输格式

【Redis】缓存雪崩、缓存击穿、缓存穿透

通过示例学习 JavaScript 运算符 - 逻辑、比较、三元和更多 JS 运算符

基于微信小程序+Springboot校园二手商城系统设计和实现

excel 动态表头与合并列

jenkins自动部署微服务到docker

【蔚来汽车】蔚来20220713第三题-旅游规划＜模拟、滑动窗口＞

[解决方案]Antd TreeSelect/Select placeholder失效

微人事部门管理模块（十五）

【Terraform学习】使用 Terraform 从 EC2 实例访问 S3 存储桶（Terraform-AWS最佳实战学习）

ZDRE6VP4-1X/50MG24K4V比例压力阀放大器

纠缠辅助的量子网络：原理、技术、发展与挑战

React Native 可触摸组件基础知识

用户、权限和Vim编辑器

git版本管理加合并笔记

Failed to load property source from location ‘classpath:/application.yml‘

Ajax复习

里式替换原则(LSP)

mysql------做主从复制，读写分离

Anaconda虚拟环境跨系统迁移

第四章 IRIS 编程简介 - Macros

大厂考核重点：mysql索引面试题

MySQL使用binlog日志做数据恢复

USB Type-C端口集成式ESD静电保护方案安全低成本

Shiro学习总结

AS中回退git历史版本并删除历史提交记录

线性代数的学习和整理5：矩阵的加减乘除及其几何意义

sqlsugar 使用TNS连接oracle

用python解压zip文件

1、版面分析

数据集：

2、文本分析

​

3、表格

相关文章：