当前位置: 首页 > news >正文

服务器数据恢复—Lustre分布式文件系统下服务器节点进水的数据恢复案例

服务器数据恢复环境&故障:
5台节点服务器,每台节点服务器上有一组RAID5阵列。每组RAID5阵列上有6块硬盘(其中1块硬盘设置为热备盘,其他5块硬盘为数据盘)。上层系统环境为Lustre分布式文件系统。
机房天花板漏水导致这5台节点服务器进水,每台服务器都有至少2块硬盘出现故障。每台服务器中的RAID5阵列短时间内同时掉线2块或以上数量的硬盘,导致RAID崩溃,服务器中数据无法正常读取。

服务器数据恢复过程:
1、将所有服务器中的硬盘做好标记后取出,硬件工程师对所有硬盘进行硬件故障检测。通过更换磁头、修复固件等方式,对存在故障且无法读取的硬盘进行修复。修复完成后以只读方式镜像故障硬盘。没有出现故障的硬盘也以只读方式进行全盘镜像。所有硬盘镜像完成后,按照原样将所有硬盘还原到服务器中。后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析所有磁盘底层数据,获取RAID校验形式、条带大小、盘序等重组RAID的相关信息,利用这些RAID信息虚拟重组所有RAID。
3、解析Lustre分布式文件系统。
Lustre分布式系统由元数据卷(MDS)和数据卷(OST)组成,重组RAID后就可以得到MDS分区和OST分区。Lustre文件系统中所有文件的文件名、文件路径等属性信息存放在MDS分区;文件对应的数据内容全部存放在OST分区。
MDS分区是一个EXT3文件系统,除了节点类型为文件的解析方式不同之外,其余所有解析方式和Ext3一样。
从MDS分区中获取到整个Lustre中所有文件的目录结构,文件名称,文件编号,所属OST号等属性信息。

4、根据从MDS分区中获取到的目录结构、文件名称、文件编号、所属OST号等属性信息,北亚企安数据恢复工程师整理重构出文件的原始路径,并定位到索引的OST卷及相关数据区域,获取相关数据文件。直至恢复出所有数据。
5、随机抽取部分文件校验,所有抽检的文件正确无误。对恢复数据的数据量进行校验也没有发现问题。用户方确认数据完整恢复,目录结构完好。北亚数据恢复工程师协助用户方工程师将恢复出来的数据迁移到用户方准备好的设备环境中。

http://www.lryc.cn/news/509547.html

相关文章:

  • 由于这些关键原因,我总是手边有一台虚拟机
  • word无法创建工作文件,检查临时环境变量。
  • 照亮技术传播之路:构建卓越的技术文档
  • 20241225在ubuntu20.04.5下监控SSD
  • Flink定时器
  • 《算力互联互通标准体系1.0》发布,为算力互联成网发展提供指导框架
  • 视频监控平台:Liveweb视频汇聚融合平台智慧安防视频监控应用方案
  • STM32串口第一次接收数据时第一个字节丢失的问题
  • Zookeeper基本命令解析
  • RustDesk远程及自建服务器搭建教程
  • 广州大彩串口屏安卓/linux触摸屏四路CVBS输入实现同时显示!
  • Python:模拟(包含例题)
  • Python OCR 文字识别
  • 阿里巴巴2017实习生笔试题(二)
  • Docker安装与使用
  • 通过nginx设置一个图片服务器,并使用 Nginx 作为反向代理
  • MacOS M3源代码编译Qt6.8.1
  • 【Pytorch实用教程】PyTorch 自带的数据集全面解读
  • Flask使用的正例和反例
  • 2024年河北省职业院校技能大赛云计算应用赛项赛题第2套(私有云)
  • 我的软件架构师——Java 职位面试经历。
  • npm error code ETIMEDOUT
  • (11)(3.2) ESC信号问题
  • Postman最新接口自动化持续集成
  • windows nacos安装配置
  • 重温设计模式-外观模式和适配器模式的异同
  • 数据中台从centos升级为国产操作系统后,资源增加字段时,提交报500错误
  • 云原生后端开发(一)
  • 实现用户登录系统的前后端开发
  • 双刃剑下的机遇与风险:交易中的杠杆效应