当前位置: 首页 > news >正文

onlyoffice实现文档比对(Beta版)-纯文字比对(非OCR)

一、说明

        文档比对光靠前端或者后端是无法实现的。

        该文中的实现方案为:onlyoffice+java。java进行文档差异化比较并输出对比结果,only进行得到结果处理+渲染。

        此方案目前为Beta版本,简单Word Demo实现了比对结果。css、关联动态效果登将在后期逐步优化。

        查看地址:onlyoffice-曹瑞版本演示站A Modern Back-end Management Systemicon-default.png?t=O83Ahttp://47.94.91.67/#/onlyoffice_doc/main

二、预览

三、onlyoffice端实现思路

        onlyoffice作为前端展示,其实只需要按照后端返回的比对结果分别对文本块进行【类型】标记渲染就可以了,比如:

        1、比如从后端获取得到的比对结果为:【下样例】,标记被比较文档中第一个段落中【新增】两个字为变动内容。

{type:addition, changeParagraph:0, startPos:3, endPos:5}

       2、以【预览模式】打开文档,这里推荐使用预览模式打开,因为对于查看文档而言,需要屏蔽鼠标键盘误操作导致修改了原始文档,造成数据问题。

        3、清洗文档格式,尽可能让文档内容保持清晰,方便后续的标记比对查看。我的方案中处理:批注、超链接、书签,其他更多的对象也可以由开发者自行适配。

        4、打开预览编辑模式,准备渲染。

        5、根据【1】中的数据标识结构,分别进入比较文档和被比较文档中找到对应的区块进行渲染。

        6、到这里其实核心就结束了,剩下的就是外层HTML的dom渲染和事件绑定之类的,这个就看个人对品质的要求。

四、后记-个人用

        尝试思考:OCR+段落聚合+自然文本拼接,向做得更好的平台学习。

http://www.lryc.cn/news/496569.html

相关文章:

  • JS querySelector方法的优点
  • 利用获取商品详情API:item_get可以获取到淘宝商品详情的哪些数据?
  • 【大数据学习 | 面经】Spark 3.x 中的AQE(自适应查询执行)
  • [Vue]Vue-router
  • 【HarmonyOS】鸿蒙应用使用lottie动画
  • 1.使用docker 部署redis Cluster模式 集群3主3从
  • vue基础之8:computed对比watch
  • Luban数据插件的用法
  • 指针(上)
  • 张伟楠动手学强化学习笔记|第一讲(上)
  • python脚本:Word文档批量转PDF格式
  • 性能测试常见面试问题和答案
  • uniapp进阶技巧:如何优雅地封装request实例
  • 实验五、流式视频服务程序mjpg-streamer移植实验
  • (长期更新)《零基础入门 ArcGIS(ArcMap) 》实验三----学校选址与路径规划(超超超详细!!!)
  • L16.【LeetCode笔记】前序遍历
  • 泰州榉之乡全托机构探讨:自闭症并非家庭的 “末日”
  • BiGRU:双向门控循环单元在序列处理中的深度探索
  • 【vue-router】Vue-router如何实现路由懒加载
  • Linux网络编程基础
  • MySQL中的幻读问题
  • AI后端工程师面试题的内容
  • MFC工控项目实例三十五读取数据库数据
  • OpenWrt -制作ubifs文件系统的固件
  • C++ - 继承
  • 华为服务器使用U盘重装系统
  • 网络分层模型( OSI、TCP/IP、五层协议)
  • 前端开发 之 15个页面加载特效上【附完整源码】
  • Spring Boot使用JDK 21虚拟线程
  • 《从0到1常用Map集合核心摘要 + 不深不浅底层核心》