当前位置: 首页 > news >正文

金鸣识别将无表格线的图片转为excel的几个常用方案

15815753e5c22208b0f889b6bd4dbb34.jpeg

我们知道,金鸣识别要将横竖线齐全的表格图片转为excel非常简单,但要是表格线不齐全甚至没有表格线的图片呢?这就没那么容易了,在识别这类图片时,我们一般会使用以下的一种或多种方法进行处理:

1. 基于布局分析:金鸣识别系统可以通过分析文本在图像中的相对位置和排列方式,推断出表格的结构。基于布局的方法可以识别出表格的行列结构,并将文本与相应的表格元格对应起来。这种方案一般适用于有比较规范的表格结构、横竖列排版整齐的图片。这类一般比较好处理,无需AI训练即可完成比较准确的识别。

2. 基于文本特征:金鸣识别系统可以利用表格元素周围的文本特征来推断表格的结构。例如,如果某一行或某一列中的所有单元格都包含数字或日期,而且这些单元格的文本特征相似,那么可以推断这一行或这一列是表格的某一行或某一列。

3. 基于线条检测:金鸣识别系统可以使用图像处理技术来检测表格中的线条。即使表格线条不明显,通过检测文本周围的直线特征也可以推断出表格的结构。这种方案一般用于大多数内容有表格线,但又缺少一些的图片。

4. 基于机器学习:金鸣识别系统可以通过训练模型来学习无表格线表格的结构特征。利用机器学习算法,系统可以分析大量的无表格线表格数据,提取特征并建立模型,进而预测和识别其他无表格线表格的结构。这种方案可以识别复杂表格图片,但过程会比较复杂,成本也比较高,但相对来说效果也是比较好的。

这几种方案有好有坏,不同的样式的图片可以采用不同的方案,我们一般混合着用,以达到更佳的效果。

#excel技巧#
http://www.lryc.cn/news/115307.html

相关文章:

  • 刚刚更新win11,记事本消失怎么处理?你需要注意些什么?
  • 【QT】 QTabWidgetQTabBar控件样式设计(QSS)
  • 【个人记录】CentOS7 编译安装最新版本Git
  • 【Linux】计算机网络的背景和协议分层
  • 代理模式:静态代理+JDK/CGLIB 动态代理
  • gps虚拟定位 AnyGo for Mac 中文
  • LLM reasoners 入门实验 24点游戏
  • 【LeetCode 算法】Maximum Absolute Sum of Any Subarray 任意子数组和的绝对值的最大值-前缀和
  • 怎么建立大型语言模型
  • docker简介和安装
  • 记录问题: servlet获取项目包绝对路径
  • C语言文件操作基本方法
  • SQL 相关子查询 和 不相关子查询、Exists 、Not Exists、 多表连接(包含自连接)
  • 项目规范 编写规范(范例)
  • MongoDB数据库操作及操作命令
  • Linux命令(62)之tee
  • 搭建Repo服务器
  • 安卓:MMKV——键值存储库
  • 使用Python将图像转换为PDF:一次性解决您的批量转换需求
  • Vue——webpack
  • springboot房地产管理java购房租房二手房j客户sp源代码mysql
  • Gartner 发布影响数据科学和机器学习未来方向重要趋势
  • 72. 编辑距离
  • Android12.0 原生系统SystemUI下拉状态栏和通知栏视图之锁屏通知布局
  • 周末在家值班,解决几个月前遗忘的Bug
  • Shell编程基础(十五)文本三剑客(sed)
  • 5,二叉树【p6-p7】
  • 【Spring】如果你需要使用重试机制,请使用Spring官方的Spring Retry
  • pagehelper 优化自定义分页和排序位置
  • Linux下查询文件夹中文件数量的方法