当前位置: 首页 > news >正文

Mongo Java Driver使用getCollection做分页查询遇到的一些坑

背景

最近在做Mongo上的表数据的迁移,原本应该是DBA要干的活,但是想着DBA排期比较长,加上我们开发的权限又非常有限,而且数据量又没有多少,就想着自己开发个小小的程序从旧实例上查,写到新实例上去算了。于是就遇到了今天要分享的这个坑。

有问题代码

这个方法目的是查询表的所有数据,但是返回的结果实际会有问题,返回来的并非全量数据。原因是分好页之后,在去查询每页的数据的时候都重新再查询了下集合,然后再取分页数据,这个过程中有其他的线程也去修改这个集合的数据,集合数据变化了就会导致查询到的分页数据不正确。

   /*** 这个方法目的是查询表的所有数据,但是返回的结果实际会有问题,会出现数据不完整* 原因是分好页之后,查询每页的数据的时候都重新查询了集合,这个过程中有其他的线程也去修改这个集合的数据,* 集合数据变化了就会导致查询到的分页数据不正确。* @param dbName* @param tableName* @return*/public List<Document> queryCollections_Error(String dbName, String tableName) {List<Document> result = new ArrayList<>();long count = this.count(dbName, tableName);int pageSize = 1000;for (int idx = 0; idx < count; idx += pageSize) {result.addAll(this.queryCollectionsByPage(dbName, tableName, idx, pageSize));}return result;}

改正后的代码

改正后的代码,是只能保证了在程序开始运行的这一刻mongo表的快照的数据同步到新表是准确的,但是同步程序运行过程中如果表数据发生了变更,这部分数据是没有变更到新实例上面去的,这个大家需要注意。我们的业务是对内的业务,而且数据量不大,因此在同步的时候禁写掉这个服务中断时间可以接受。如果是不可接受服务中断,那么应该要考虑下全量+增量的方案。

    public List<Document> queryCollections(String dbName, String tableName) {List<Document> result = new ArrayList<>();MongoCollection<Document> mongoCollection = this.mongoClient.getDatabase(dbName).getCollection(tableName);long count = mongoCollection.countDocuments();int pageSize = 1000;for (int idx = 0; idx < count; idx += pageSize) {FindIterable<Document> iterable = mongoCollection.find().skip(idx).limit(pageSize);iterable.forEach(new Block<Document>() {@Overridepublic void apply(Document document) {result.add(JSON.parseObject(JSON.toJSONString(document), Document.class));}});}return result;}

完整代码

下载

http://www.lryc.cn/news/455289.html

相关文章:

  • RK3568笔记六十四:SG90驱动测试
  • 31 基于51单片机的水位监测系统仿真
  • Docker 实践与应用举例
  • 公开数据集网站分享
  • 实验OSPF路由协议(课内实验)
  • GPU Puzzles讲解(一)
  • 滚雪球学Oracle[1.3讲]:内存与进程架构
  • Nginx的正向与反向代理
  • esp8266 at指令链接wifi时一直connect disconnest
  • 基于SpringBoot博物馆游客预约系统【附源码】
  • 【JVM】内存区域划分,类加载的过程,.class文件的格式
  • esp32-camera入门(基于ESP-IDF)
  • react中类式组件与函数式组件的区别
  • 【D3.js in Action 3 精译_030】3.5 给 D3 条形图加注图表标签(下):Krisztina Szűcs 人物专访 + 3.6 本章小结
  • 【重学 MySQL】五十六、位类型
  • Centos7 NTP客户端
  • 手机号归属地查询-手机号归属地-手机号归属地-运营商归属地查询-手机号码归属地查询手机号归属地-运营商归属地
  • CoppeliaSim和Matlab建立远程连接教程
  • 使用STS以及签名URL临时授权访问OSS资源
  • Next.js 14 使用 react-md-editor 编辑器 并更改背景颜色
  • 【Iceberg分析】Spark与Iceberg集成落地实践(一)
  • 【Verilog学习日常】—牛客网刷题—Verilog进阶挑战—VL45
  • 【强训笔记】day27
  • Nginx06-静态资源部署
  • MySQL数据库专栏(二)SQL语句基础操作
  • 【OpenCV 实战】1.手势虚拟拖拽(双手骨骼点识别)
  • 基于springboot人力资源管理系统源码
  • 如何使用 Apt-Get 和 Apt-Cache 在 Ubuntu 和 Debian 中管理软件包
  • Linux系统创建新分区并挂载的方法
  • 反射第二弹:用注册器动态注册(用自定义的注解标注的)策略,实现策略模式的设计