当前位置: 首页 > news >正文

MySQL按序批量操作大量数据

MySQL按序批量操作大量数据(Java、springboot、mybatisplus、ElasticSearch)

以同步全量MySQL数据到ElasticSearch为例。

核心代码

业务逻辑:

 public boolean syncToElasticsearch() {log.info("Starting data synchronization to Elasticsearch.");// 获取最大id和最小idIdRange idRange = newsMapper.getIdRange();log.info("idRange is:{}", JSON.toJSONString(idRange));if (idRange == null || idRange.getMinId() <= 0 || idRange.getMaxId() <= 0) {log.warn("Invalid id range or no data found in MySQL. Sync process aborted.");return false;}long pageSize = 200L;long startId = idRange.getMinId();try {// 循环处理所有数据while (startId <= idRange.getMaxId()) {// 业务逻辑 可以替换成自己需要的log.info("syncToElasticsearch startId:{}", startId);List<News> newsList = newsService.getByIdRange(startId, pageSize);log.info("syncToElasticsearch newsList size:{}", newsList.size());if (CollectionUtils.isEmpty(newsList)) {break;}newsEsService.bulkUpsertToElasticsearch(getNewsEsDTOList(newsList));// 更新startIdstartId = newsList.get(newsList.size() - 1).getId() + 1;log.info("Synced {} Newss to Elasticsearch, current id is:{}", newsList.size(), startId);}} catch (Exception e) {log.error("Error occurred during News data synchronization to Elasticsearch.", e);return false;}log.info("Data synchronization to Elasticsearch completed.");return true;}

mapper:

public interface NewsMapper extends BaseMapper<News> {/*** 获取最小和最大id值的范围** @return*/@Select("SELECT MIN(id) AS minId, MAX(id) AS maxId FROM news")IdRange getIdRange();
}

newsService:

    public List<News> getByIdRange(long startId, long pageSize) {if (startId <= 0 || pageSize <= 0) {return Collections.emptyList();}return this.list(new LambdaQueryWrapper<News>().ge(News::getId, startId).orderByAsc(News::getId).last("limit " + pageSize));}

实体类定义:

@Data
public class IdRange {private Long minId;private Long maxId;
}

为什么不直接用分页?

页面深度越大查询性能越慢,当表有大量数据时处理后面的数据会很耗时。

http://www.lryc.cn/news/261176.html

相关文章:

  • strict-origin-when-cross-origin
  • 【置顶】 本博博文汇总
  • react.js源码二
  • 如何学习英语
  • robot测试自动化
  • Linux---重定向命令
  • 小区生活污水处理需要哪些设备和工艺
  • 【高性能计算】Cpp + Eigen + Intel MKL + 函数写成传引用
  • 【教学类-05-02】20231216 (比大小> <=)X-Y之间的比大小88题(补全88格子,有空格分割提示)
  • 【Spark精讲】Spark与MapReduce对比
  • SQL错题集3
  • Elasticsearch:使用 OpenAI 生成嵌入并进行向量搜索 - nodejs
  • [python高级编程]:02-类
  • java.lang.UnsupportedOperationException异常解决
  • openmediavault debian linux安装配置企业私有网盘(三 )——raid5与btrfs文件系统无损原数据扩容
  • Two Phase Termination(两阶段)设计模式
  • 闲人闲谈PS之四十九——PLM和SAP集成常见的问题
  • 帆软BI目录
  • (第8天)保姆级 PL/SQL Developer 安装与配置
  • 【CSS】前端点点点加载小点样式css动画过程实现
  • 【LeetCode: 2415. 反转二叉树的奇数层 | BFS + DFS】
  • 期货股市联动(期股联动助推资本市场上扬)
  • 生成式AI的力量,释放RPA的无限潜能
  • 【leetcode】链表总结
  • 焦虑,其实是你自愿选择的
  • 4G无线工业级路由器在智能制造设备互联互通中的角色
  • gitbash下载安装
  • 系列一、Linux中安装MySQL
  • 开辟“护眼绿洲”,荣耀何以为师?
  • Modbus RTU和Modbus TCP的区别 深入篇