当前位置: 首页 > news >正文

讲一个自己写的 excel 转 html 的 java 工具

由来

这是一个从开发需求中诞生的工具,在工作中因为有一个 excel 转 html 的任务,又没找到一个专门做这方面的工具(其他工具几乎都是简单的转换,无法还原 excel 样式,而且转换的宽高有点儿差距),所以干脆自己动手写了一个。几乎能够还原 excel 样式,且宽高几乎一致。

用法

需要注意的是,仅支持 xlsx 格式,且默认 dpi 是 96,因为不同屏幕的 dpi 可能不太一样(大多数是 96),所以尽量前端传过来,前端获取屏幕 DPI 参考:https://blog.csdn.net/jl15988/article/details/144737210

引入依赖

<dependency><groupId>com.jl15988.excel2html</groupId><artifactId>excel2html</artifactId><version>0.0.1</version>
</dependency>

使用

 List<HtmlPage> htmlPages = new Excel2Html(new File(respVO.getTempPath())).setDpi(dpi).setCellHandler(new ICellHandler() {@Overridepublic void handleStyle(ParserdStyleResult parserdStyleResult, Cell cell, int rowIndex, int cellIndex) {// 去掉第一行单元格顶部边框if (rowIndex == 4) {parserdStyleResult.cellStyle.remove("border-top");}}}).buildHtmlWithSheetIndex(4, null, 4, 46, 0, 29);
List<String> wbContent = htmlPages.stream().map(htmlPage -> htmlPage.setHasHtmlContainer(false).toHtmlString()).collect(Collectors.toList());

支持自定义单元格处理器(setCellHandler),单元格内容格式化处理(setCellValueFormater)

还有其他构建 html 方法

  • buildHtml(Sheet sheet, Integer startRowIndex, Integer endRowIndex, Integer startColIndex, Integer endColIndex)
  • buildHtmlWithSheetIndex(int sheetIndex, Integer startRowIndex, Integer endRowIndex, Integer startColIndex, Integer endColIndex)
  • buildHtmlWithSheetIndex(Integer startSheetIndex, Integer endSheetIndex, Integer startRowIndex, Integer endRowIndex, Integer startColIndex, Integer endColIndex)
  • buildHtml(Sheet sheet)
  • buildHtmlWithSheetIndex(int sheetIndex)
  • buildHtmlWithSheetIndex(Integer startSheetIndex, Integer endSheetIndex)

难点(均实现)

难点是实现的时候比较难,不代表没有实现。因为使用的是 apache.poi 依赖读取 excel,该依赖仍有某些不足,成为转 html 难点。

  1. 读取 excel 图片。excel 中图片有两种,第一种是浮动式,第二种是嵌入式,浮动式还好说 poi 能读取到,但是嵌入式只能自己解析 excel 内容,然后找到对应图片。excel 其实是一个压缩包,将其解压读取 xml 配置即可;
  2. 渲染图片位置。因为获取到的浮动式图片位置为 emu 单位,且是所在单元格坐标的信息,单位转换和坐标计算有所难点;
  3. 列宽。poi 读取到的列宽不准确,poi 中默认列宽写死了一个 8(字符宽度),这个 8 只是大概值,准确值需要自己计算;而且 poi 像素值都是乘了一个写死的 7.001699924468994(字符像素大小),这个值也是不准确的,这个值应该是 excel 默认字体的像素大小(一般国内都是默认宋体,像素大小为 8,差距也有点儿大),这个需要建立映射表,通过脚本将系统所有字体像素大小放到映射中,使用的时候再读取;
  4. 富文本解析。富文本是指在同一个单元格使用不同的字体样式。这个需要对单元格内容单独解析,构造 html 样式,这个难点不算太大;
  5. 空白字符处理。在 excel 中,连续空白字符是保留的,html 默认只显示一个,需要单独写样式,这个比较简单;如果单元格内容尾部含有空白字符且自动换行,空白字符是不占用空间的(目前看是这样),这个需要单独判断。
http://www.lryc.cn/news/510685.html

相关文章:

  • 前端往后端传递参数的方式有哪些?
  • Vue axios 异步请求,请求响应拦截器
  • yarn install 安装报错:Workspaces can only be enabled in private projects.
  • http 请求总结get
  • TCP 和 UDP 的区别:解析网络传输协议
  • 【已解决】pyinstaller打包ico图片报错:OSError: [WinError 225] 无法成功完成操作,因为文件包含病毒或潜在的垃圾软件。
  • SpringBoot项目配置文件的优先级
  • JS中类型化数组(Typed Arrays)详解和常见应用场景
  • 虚幻引擎是什么?
  • LabVIEW生物医学信号虚拟实验平台
  • 【软件工程】十万字知识点梳理 | 期末复习专用
  • Android --- 在AIDL进程间通信中,为什么使用RemoteCallbackList 代替 ArrayList?
  • ADC(二):外部触发
  • 数仓开发那些事(8)
  • 【CSS in Depth 2 精译_096】16.4:CSS 中的三维变换 + 16.5:本章小结
  • 【连续学习之ResCL算法】2020年AAAI会议论文:Residual continual learning
  • 【zookeeper核心源码解析】第二课:俯瞰QuorumPeer启动核心流程,实现选举关键流程
  • 数据流图和流程图的区别
  • 关于内网服务器依托可上网电脑实现访问互联网
  • 期权懂|期权入门知识:如何选择期权合约?
  • 如何用gpt来分析链接里面的内容(比如分析论文链接)和分析包含多个文件中的一块代码
  • Bash 脚本教程
  • Pinia最简单使用(vite+vue3)
  • 计算机网络——期末复习(4)协议或技术汇总、思维导图
  • Microsoft word@【标题样式】应用不生效(主要表现为在导航窗格不显示)
  • 轮播图带详情插件、uniApp插件
  • 云计算时代携程的网络架构变迁
  • USB 状态机及状态转换
  • Go C编程 第6课 无人机 --- 计算旋转角
  • C++-----图