当前位置: 首页 > news >正文

超大excel文件读,避免内存溢出

excel40M+,但是用传统的读取excel方法,会报内存溢出的错误。

所以采用了下面的方式,能解决此问题:

maven依赖

<dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>4.0.0</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>4.0.0</version>
</dependency>
<dependency><groupId>org.apache.poi</groupId><artifactId>poi-scratchpad</artifactId><version>4.0.0</version>
</dependency><!-- 读取大量excel数据时使用 -->
<dependency><groupId>com.monitorjbl</groupId><artifactId>xlsx-streamer</artifactId><version>2.1.0</version>
</dependency>

 代码:

import com.monitorjbl.xlsx.StreamingReader;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;import java.io.FileInputStream;
import java.util.ArrayList;
import java.util.List;
import java.util.Locale;public class Main {public static void main(String[] args){try{FileInputStream fis = new FileInputStream("D:\\d\\2023财年\\新疆\\a.xlsx");Workbook wk = StreamingReader.builder().rowCacheSize(100)  //缓存到内存中的行数,默认是10.bufferSize(4096)  //读取资源时,缓存到内存的字节大小,默认是1024.open(fis);  //打开资源,必须,可以是InputStream或者是File,注意:只能打开XLSX格式的文件int sheetNums = wk.getNumberOfSheets();System.out.println(sheetNums);List<String> sheets = new ArrayList<>();for(int i = 0 ; i < sheetNums;i ++){Sheet sheet = wk.getSheetAt(i);String sheetName = wk.getSheetName(i);//遍历所有的行for (Row row : sheet) {StringBuilder sb = new StringBuilder();//遍历所有的列for (Cell cell : row) {sb.append(cell.getStringCellValue().replaceAll("\\s+", "").toUpperCase(Locale.ROOT) + ",");}if(sb.toString().contains("模型名称")){sheets.add(sb.toString().replaceAll("模型名称:", "").replaceAll("模型名称:", "").replaceAll("表名:", ","));}}}for(String data: sheets){System.out.println(data);}}catch (Exception e){e.printStackTrace();}}
}

http://www.lryc.cn/news/65881.html

相关文章:

  • 第0章 学习之前的准备
  • 数组排序sort()方法
  • 【.NET AI Books 前言】Azure OpenAI Service 入门
  • 散列查找实验(开散列) 题目编号:583
  • Java版spring cloud 企业工程项目管理系统平台源码(三控:进度组织、质量安全、预算资金成本、二平台:招采、设计管理)
  • Go type关键字定义新类型和类型别名的区别
  • Neural Network学习笔记2
  • 用@Value注解为bean的属性赋值
  • 拨云见日:深入理解 HTML 解析器与有限状态机
  • Java线程池及其实现原理
  • 进程替换函数组介绍exec*
  • 欧科云链OKLink:2023年4月安全事件盘点
  • KubeVirt备份与还原方案【翻译】
  • 使用PyQt5设计一款简单的计算器
  • Htop使用说明
  • PostgreSQL Linux安装
  • 亚商投资顾问 早餐FM/0509车辆电动化
  • AI绘画天花板——Midjourney注册使用保姆级教程(5月5日验证有效)
  • 学习笔记(2)项目结构描述 - manifest.json和pages.json
  • vector、deque、list相关知识点
  • 多维时序 | MATLAB实现基于VMD-SSA-LSSVM、SSA-LSSVM、VMD-LSSVM、LSSVM的多变量时间序列预测对比
  • 设计模式——适配器模式(类适配器、对象适配器)
  • iOS开发多target
  • 100种思维模型之每日评估思维模型-58
  • libreoffice api
  • 全网最火,Web自动化测试驱动模型详全,一语点通超实用...
  • 如何写软件测试简历项目经验,靠这个面试都要赶场
  • 【Linux】Linux下安装Mysql(图文解说详细版)
  • Cookie和Session的API、登录页面
  • C++数据结构:手撕红黑树