当前位置: 首页 > news >正文

OCR转换技巧:如何避免图片转Word时出现多余的换行?

8d7f89f3eaccf2918bc2274817a99cc2.jpeg

在将图片中的文字识别转换为Word文档时,我们很多时候时会遇到识别内容的一个自然段还没结束就换行的问题,这些就是我们常说的多余换行的问题。为什么会产生这个问题呢?主要是由于OCR返回的识别结果是按图片上的文字换行而换行,而不是以自然段为换行依据。

054e4cd92f4cfa4a849ed4a029b9f965.jpeg

这会产生什么样的危害呢?一是word中会出现很多多余的回车符,看起来很是障眼,特别是对有“洁癖”的人来说,心里更不是滋味,怎么办呢?

笔者推荐的方法是使用金鸣表格文字识别大师来解决。具体操作方法如下:

4c0289d9800762bfc9ed4d4a15952efd.jpeg

一、使用高精还原的“智能优化”输出。选择这种输出方式,程序会调用AI智能分段

06650469a836c3cc3b0b1c9242698be1.jpeg

功能,将自动识别自然段,只有满足一个自然段的条件下才会换行。这种输出方式最适合文字较多的图片,如文章、图书、公文等。

ffd0674beccac73a395cd614970656d3.jpeg

二、使用高精还原的“还原结构”。还原结构即还原排版,使用这种方式输出,程序在OCR识别后会根据图片上的文字坐标,还原原有的文字排版,从而避免出现多余的换行。采用这种方式的好处是能还原排版,缺点是图片需要保持整洁和端正,如果图片上的文字排列歪了的话,出来的word排版也会歪,因此,这种输出方式最适合截图识别,以及用传统扫描仪成像的图片识别。

df808775984312e3131ab0cd857d43fb.jpeg

在金鸣表格文字识别移动端,“分段优先”对应“智能优化”,而“排版优先”则对应“还原结构”,它们转出来的效果跟电脑软件是一样的。

974769aa20a088cdaf2b148b4ff4406e.jpeg

另外一种处理方法就是OCR识别后手工处理。在OCR识别后,可以使用文本编辑软件(如Notepad++、Sublime Text等)对识别结果进行处理。例如,可以使用“查找和替换”功能来删除多余的换行符;或者使用“段落格式化”功能来重新排版文本。这种方法比较麻烦,会增加较多的工作量。

总之,为了避免在将图片转换为Word文档时出现多余的换行问题,我们可以选择专业的OCR软件(如金鸣表格文字识别大师),以及进行识别后处理手工处理等方法。这些方法能够有效地提高OCR识别的准确性,并避免出现不必要的换行问题。#word技巧#
http://www.lryc.cn/news/232058.html

相关文章:

  • 抖音小店怎么对接达人?如何避免达人白嫖样品?实操经验分享!
  • Xocde 升级15 或者 iOS17报错:
  • Apache配置ssl证书-实现https访问
  • layer 弹框让按钮取消自动获取焦点
  • 计算机二级Office真题解析 excel减免税,订单,成绩
  • Spring Cloud Netflix微服务组件-Hystrix
  • 【6】Spring Boot 3 集成组件:knift4j+springdoc+swagger3
  • 从零搭建微服务架构:Spring Boot与Nacos完美整合
  • 原来你不会找资源,三个宝藏白嫖书籍网站,阅读改变生活(一)
  • linux rm文件后空间不释放怎么处理
  • vue中el-tree树形组件利用filter和 filterNode方法实现模糊搜索
  • 克鲁斯卡尔算法(C++)
  • 【Shell脚本 4】测试用
  • DC电源模块对效率有什么要求?
  • Linux在线安装MySQL8.0.24安装、MySQL数据备份和恢复
  • 【python】OpenCV—Rectangle, Circle, Selective Search(1.2)
  • MongoDB是一个NoSQL数据库,有着多种不同的命令和操作。以下是一些常见的MongoDB命令:
  • 网络运维Day19
  • 颜色标记txt和多根走线【Cadance进阶】
  • 你是想被ChatGPT改变,还是改变软件开发的未来?丨IDCF
  • Homography详解在MVSNet中的应用
  • linux parted给磁盘分区
  • 大数据毕业设计选题推荐-机房信息大数据平台-Hadoop-Spark-Hive
  • 使用 PYTORCH 进行图像风格迁移
  • vscode使用flake8设置单行最长字符限制设置失败的问题
  • SAP KO22内部订单预算BAPI与BDC
  • K8S篇之实现利用Prometheus监控pod的实时数据指标
  • 智能巡检软件怎么选?企业设备管理需要做什么?
  • 【python】Django——连接mysql数据库
  • 北京君正客户应用案例:掌静脉3D人脸猫眼视屏智能锁