当前位置: 首页 > news >正文

POI优化Excel录入

57000+单词原始录入时间258S

核心代码:

List<Word> wordBookList = ExcelUtil.getReader(file.getInputStream()).readAll(Word.class);if (!CollectionUtil.isEmpty(wordBookList)) {for (Word word : wordBookList) {//逐条向数据库中插入单词wordMapper.insert(word);}}

线程池方式录入时间18S

核心代码:

//获取核心数int coreCount = Runtime.getRuntime().availableProcessors();//创建线程池ExecutorService executorService= Executors.newFixedThreadPool(2*coreCount);List<Word> wordBookList = ExcelUtil.getReader(file.getInputStream()).readAll(Word.class);//对列表单词进行分区并发录入int partitionSize=wordBookList.size()/(2*coreCount);List<List<Word>> wordListPartition = Lists.partition(wordBookList, partitionSize);for (int i = 0; i <wordListPartition.size(); i++) {Runnable task=new ExcelInput(wordListPartition.get(i),wordMapper);executorService.execute(task);}executorService.shutdown();//阻塞当前线程,直到线程池中的任务执行完毕try {if(!executorService.awaitTermination(1, TimeUnit.HOURS)){executorService.shutdownNow();}} catch (InterruptedException e) {e.printStackTrace();Thread.currentThread().interrupt();}

优化流程:

首先获取当前主机核心数N,因为大数据量单词录入属于IO密集型所以我们设置线程池的大小为2*N第二步我选择将List拆分为2*N接着放入线程池当中去执行单词录入任务基于此线程池中的多个线程可以对数据的录入进行并发操作大大提高了录入的效率

选择2*N的原因是代码中获取的核心数为物理核心数,而实际上主机可以利用超线程技术将一个物理核心当做两个逻辑核心来使用,当我们想让CPU利用率达到100%时就可以设置2*N个线程数并将单词分为2*N份交给线程池中的线程处理同时减少了线程的上下文切换所带来的损耗。

240/258=0.93

优化后单词录入效率提高90%以上

http://www.lryc.cn/news/538998.html

相关文章:

  • 实时图像与视频超分辨率:高效子像素卷积网络(ESPCN)解析
  • QT--对话框的切换
  • 深入浅出:CUDA是什么,如何利用它进行高效并行计算
  • Zotero PDF Translate插件配置百度翻译api
  • 利用acme.sh 申请 Google 免费证书
  • 腾讯云cloudstudio使用笔记(一)
  • python自动化制作常规的日报数据可视化
  • C语言:在主函数中输入十个等长的字符串。用另一函数对它们排序,然后在主函数输出这10个已排好序的字符串。
  • 构建高效智能对话前端:基于Ant Design X 的deepseek对话应用
  • SQLMesh 系列教程5- 详解SQL模型
  • 本地DeepSeek模型GGUF文件转换为PyTorch格式
  • Flutter:动态表单(在不确定字段的情况下,生成动态表单)
  • 【Python项目】文本相似度计算系统
  • C# ref 和 out 的使用详解
  • Ubuntu 24.04.1 LTS 本地部署 DeepSeek 私有化知识库
  • 用 WOW.js 和 animate.css 实现动画效果
  • 1-知识图谱-概述和介绍
  • flink jobgraph详细介绍
  • 使用nginx+rtmp+ffmpeg实现桌面直播
  • 每日一题——将数字字符串转化为IP地址
  • 机器学习数学基础:25.随机变量分布详解
  • 香港电讯与Zenlayer达成战略合作,拓展全球互联生态圈
  • MySQL-事务隔离级别
  • 【Python学习 / 6】面向对象编程(OOP)
  • Ollama DeepSeek + AnythingLLM 实现本地私有AI知识库
  • 个人博客测试报告
  • 嵌入式八股文(四)计算机网络篇
  • 基于Electron+Vue3创建桌面应用
  • 建立稳定分析模式的模式语言01
  • 【C++游戏开发-五子棋】