当前位置：首页 > news >正文

JPA 批量插入较大数据解决性能慢问题

news 2025/8/26 11:46:46

JPA 批量插入较大数据解决性能慢问题

使用jpa saveAll接口的话需要了解原理：

	@Transactional@Overridepublic <S extends T> List<S> saveAll(Iterable<S> entities) {Assert.notNull(entities, "Entities must not be null!");List<S> result = new ArrayList<>();// 使用for循环遍历for (S entity : entities) {result.add(save(entity));}return result;}@Transactional@Overridepublic <S extends T> S save(S entity) {Assert.notNull(entity, "Entity must not be null.");// 每条数据都会查询之后 做下判断if (entityInformation.isNew(entity)) {em.persist(entity);return entity;} else {return em.merge(entity);}}public boolean isNew(T entity) {ID id = getId(entity);Class<ID> idType = getIdType();if (!idType.isPrimitive()) {// 如果id有值，则认为不是新数据，则更新操作，否则就是写入操作return id == null;}if (id instanceof Number) {return ((Number) id).longValue() == 0L;}throw new IllegalArgumentException(String.format("Unsupported primitive id type %s", idType));}

以上是jpa源码，所以导致写入数据很慢。因为for遍历一行一行数据写入，而且还要判断；

以下为亲测两种解决方案：

第一种：自己编写写入逻辑，引入 EntityManager entityManager，代码如下
批量写入一批数据。一次事务提交一批。

@Value("${spring.jpa.properties.hibernate.jdbc.batch_size:1000}")private int batchSize;@PersistenceContextprivate EntityManager entityManager;public <T> void batchInsert(List<T> list) {if (!ObjectUtils.isEmpty(list)){for (int i = 1; i <= list.size(); i++) {// 写入操作entityManager.persist(list.get(i - 1));if (i % batchSize == 0) {entityManager.flush();entityManager.clear();}}if (list.size() % batchSize != 0) {//flush() 同步持久上下文环境，即将持久上下文环境的所有未保存实体的状态信息保存到数据库中。entityManager.flush();//clear() 清除持久上下文环境，断开所有关联的实体。如果这时还有未提交的更新则会被撤消。entityManager.clear();}}}public <T> void batchUpdate(List<T> list) {if (!ObjectUtils.isEmpty(list)){for (int i = 1; i < list.size(); i++) {entityManager.merge(list.get(i - 1));if (i % batchSize == 0) {entityManager.flush();entityManager.clear();}}if (list.size() % batchSize != 0) {entityManager.flush();entityManager.clear();}}}

第二种：不需要自己编写逻辑，使用jpa saveAll()方法
开启JPA批处理
在这里插入图片描述

jpa 表映射@Table 下对主键使用序列，postgre支持创建序列，可以使用，其他数据源不一定。

    @GeneratedValue(strategy = SEQUENCE, generator = "seqGen")@SequenceGenerator(name = "seqGen", sequenceName = "seq", initialValue = 1)

这样做的逻辑saveAll()不需要判断isNew,直接走em.persist(entity);

两种的性能差不多，记录下

查看全文

http://www.lryc.cn/news/94360.html

为啥离不了 linux

基于分形的置乱算法和基于混沌系统的置乱算法哪种更安全？

pve使用cloud-image创建ubuntu模板

shiro入门

开源 sysgrok — 用于分析、理解和优化系统的人工智能助手

Gitlab保护分支与合并请求

ad18学习笔记九：输出文件

PostgreSQL 内存配置与 MemoryContext 的生命周期

vue3 组件间通信的方式(setup语法糖写法)

【Cache】Rsync远程同步

Gitlab升级报错一：rails_migration[gitlab-rails] (gitlab::database_migrations line 51)

chatGPT流式回复是怎么实现的

使用SpringEL获得字符串中的表达式运算结果

力扣 39. 组合总和

基于BES系列蓝牙耳机NTC充电电池保护电路设计

13-C++算法笔记-递归

从古代八卦探究计算机的八进制

Linux shell mkfs.ext4命令参数使用

spring事务的传播性与隔离性

【设计模式】模板方法与策略模式的结合使用

Jmeter实现参数加密

Solon Web 开发：四、认识请求上下文（Context）

docker安装RocketMQ(附填坑经验connect to ＜172.17.0.3:10909＞ failed)

GRU、LSTM、注意力机制（第八次组会）

问题杂谈（三十六）@RequestBody、@RequestParam和@PathVariable三个注解的区别和使用

Flutter学习四：Flutter开发基础（六）调试Flutter应用

新的开始（开始更新笔记）

爬虫工具-替换js文件ReRes插件/Gores插件

多任务学习用于多模态生物数据分析

相关文章：