当前位置: 首页 > news >正文

数据库数据恢复—MongoDB数据库文件拷贝出现错误的数据恢复案例

MongoDB数据库数据恢复环境:
一台Windows Server操作系统的虚拟机,虚拟机上部署有MongoDB数据库。

MongoDB数据库故障&检测:
在未关闭MongoDB服务的情况下,工作人员将MongoDB数据库文件拷贝到其他分区,然后将原数据库文件所在分区进行了格式化的操作,格式化完成后将数据库文件拷回原分区,重新启动MongoDB服务,发现MongoDB服务无法启动并报错。

在MongoDB服务没有关闭的情况下,对MongoDB数据库文件进行拷贝的操作会导致mongod.lock文件以及WiredTiger.lock文件拷贝出现错误。这种情况下只需要在拷贝出来的文件中删除这两个文件,然后再次启动MongoDB服务,由MongoDB自行重新生成即可。
北亚企安数据恢复工程师检测拷贝出的数据库文件后发现_mdb_catalog.wt文件丢失。
_mdb_catalog.wt文件存储了MongoDB中所有集合的元数据,数据库启动时需要从这个文件中读取相关的信息。_mdb_catalog.wt文件丢失导致数据库无法获取数据库中集合对应的WT table名字、集合的创建选项、集合的索引信息等元数据,所以数据库无法启动。

MongoDB数据库数据恢复过程:
1、将MongoDB数据库涉及到的虚拟机进行镜像备份,后续的数据分析和数据恢复都基于镜像文件进行,避免对原始数据造成二次破坏。
2、尝试从文件系统的角度恢复_mdb_catalog.wt文件。使用工具对数据库所在分区进行扫描,扫描结果中并没有找到_mdb_catalog.wt文件的信息。根据MongoDB数据库中数据文件的特征值再次扫描数据库分区,也没有发现_mdb_catalog.wt相关的数据区域。由此可以判断,_mdb_catalog.wt文件已经被彻底覆盖破坏掉,无法恢复。只能从数据库的层面恢复数据。
3、本案例部署的MongoDB数据库是基于WiredTiger存储引擎的数据库系统,可以使用WiredTiger实用工具包提取数据库中的数据。
a、下载WiredTiger实用工具包,在windows环境下编译出可执行的wt工具。

b、完成wt工具的编译后,使用编译出来的wt工具对数据库的集合文件中的数据进行清洗回写。完成清洗回写操作后,直接读取文件中的数据并写入到一个.dump文件中。这时数据库的各个集合文件中的全部可用数据都提取出来了。
4、重新创建一个MongoDB数据库,根据提取出来的集合文件创建对应数量的空集合,然后使用编译好的wt工具将提取出来的.dump文件一一写入到新创建的空集合中。这个时候可以通过查询集合中的数据确认这些集合与元数据库中集合的对应关系。
5、修改集合名称,重建索引信息。由于该MongoDB数据库中存在Gridfs存储的大字段(文件)集合,所以通过查询集合中的记录确定记录类型。确定fs.files和fs.chunks集合的位置后,修改这两个集合名称为xxx.files和xxx.chunks,重建集合索引,Gridfs集合恢复完成,这时可以正常查看到其中数据:

6、协助用户方将全部集合重建索引后,由用户方对数据库整体进行查询验证,经过反复验证后确认数据无误,本次数据恢复工作完成。

http://www.lryc.cn/news/249537.html

相关文章:

  • 2023年11月个人工作生活总结
  • Spark-06:Spark 共享变量
  • Spring整合web环境
  • 分享从零开始学习网络设备配置--任务4.3 使用动态路由RIPng实现网络连通
  • vue2.0+elementui集成file-loader之后图标失效问题
  • C# 文件帮助类(FileHelper)
  • WordPress 外链跳转插件
  • 算法的10大排序
  • “十道机器学习问题,帮助你了解基础知识和常见算法“
  • 部署WAF安全应用防火墙(openresty部署)
  • yml转properties工具
  • zerotier 搭建 moon中转服务器 及 自建planet
  • 深入了解Rabbit加密技术:原理、实现与应用
  • Linux常用命令——mv命令
  • Panalog 日志审计系统 前台RCE漏洞复现
  • Android设置文字颜色渐变
  • java基础面试题(二)
  • php爬虫实现把目标页面变成自己的网站页面
  • [c语言c++]手写你自己的swap交换函数
  • 技术类知识汇总(二)
  • 简单好用!日常写给 ChatGPT 的几个提示词技巧
  • pytorch分布式训练
  • 【PyTorch】(三)模型的创建、参数初始化、保存和加载
  • 高效开发之:判断复杂list中的对象属性是否包含某个值
  • MacOS + Android Studio 通过 USB 数据线真机调试
  • 部署jekins遇到的问题
  • SQLY优化
  • 设计模式——行为型模式(一)
  • Rust语言入门教程(六) - 字符串类型
  • 【MATLAB源码-第92期】基于simulink的QPSK调制解调仿真,采用相干解调对比原始信号和解调信号。