当前位置: 首页 > news >正文

Linux 下最主流的文件系统格式——ext

硬盘分成相同大小的单元,我们称为块(Block)。一块的大小是扇区大小的整数倍,默认是 4K。在格式化的时候,这个值是可以设定的。

一大块硬盘被分成了一个个小的块,用来存放文件的数据部分。这样一来,如果我们像存放一个文件,就不用给他分配一块连续的空间了。我们可以分散成一个个小块进行存放。这样就灵活得多,也比较容易添加、删除和插入数据。

文件还有元数据部分,例如名字、权限等,这就需要一个结构 inode 来存放。

inode 里面有文件的读写权限 i_mode,属于哪个用户 i_uid,哪个组 i_gid,大小是多少 i_size_io,占用多少个块 i_blocks_io。i_atime 是 access time,是最近一次访问文件的时间;i_ctime 是 change time,是最近一次更改 inode 的时间;i_mtime 是 modify time,是最近一次更改文件的时间。

在 ext2 和 ext3 中,其中前 12 项直接保存了块的位置,也就是说,我们可以通过 i_block[0-11],直接得到保存文件内容的块。

i_block[12]指向一个块,这个块里面不放数据块,而是放数据块的位置,这个块我们称为间接块。也就是说,我们在 i_block[12]里面放间接块的位置,通过 i_block[12]找到间接块后,间接块里面放数据块的位置,通过间接块可以找到数据块。

对于大文件来讲,要多次读取硬盘才能找到相应的块,这样访问速度就会比较慢。

为了解决这个问题,ext4 做了一定的改变。它引入了一个新的概念,叫做 Extents。

一个文件大小为 128M,如果使用 4k 大小的块进行存储,需要 32k 个块。如果按照 ext2 或者 ext3 那样散着放,数量太大了。但是 Extents 可以用于存放连续的块,也就是说,我们可以把 128M 放在一个 Extents 里面。这样的话,对大文件的读写性能提高了,文件碎片也减少了。

Exents 会保存成一棵树。

树有一个个的节点,有叶子节点,也有分支节点。每个节点都有一个头,ext4_extent_header 可以用来描述某个节点。

这里的项分两种,如果是叶子节点,这一项会直接指向硬盘上的连续块的地址,我们称为数据节点 ext4_extent;如果是分支节点,这一项会指向下一层的分支节点或者叶子节点,我们称为索引节点 ext4_extent_idx。这两种类型的项的大小都是 12 个 byte。

如果文件不大,inode 里面的 i_block 中,可以放得下一个 ext4_extent_header 和 4 项 ext4_extent。所以这个时候,eh_depth 为 0,也即 inode 里面的就是叶子节点,树高度为 0。

如果文件比较大,4 个 extent 放不下,就要分裂成为一棵树,eh_depth>0 的节点就是索引节点,其中根节点深度最大,在 inode 中。最底层 eh_depth=0 的是叶子节点。

除了根节点,其他的节点都保存在一个块 4k 里面,4k 扣除 ext4_extent_header 的 12 个 byte,剩下的能够放 340 项,每个 extent 最大能表示 128MB 的数据,340 个 extent 会使你表示的文件达到 42.5GB。这已经非常大了,如果再大,我们可以增加树的深度。

还有一种特殊的文件格式,硬链接(Hard Link)和软链接(Symbolic Link)。ln -s 创建的是软链接,不带 -s 创建的是硬链接。

硬链接与原始文件共用一个 inode 的,但是 inode 是不跨文件系统的,每个文件系统都有自己的 inode 列表,因而硬链接是没有办法跨文件系统的。

而软链接不同,软链接相当于重新创建了一个文件。这个文件也有独立的 inode,只不过打开这个文件看里面内容的时候,内容指向另外的一个文件。这就很灵活了。我们可以跨文件系统,甚至目标文件被删除了,链接文件还是在的,只不过指向的文件找不到了而已。

此文章为11月Day8学习笔记,内容来源于极客时间《趣谈Linux操作系统》,推荐该课程。

http://www.lryc.cn/news/222886.html

相关文章:

  • 变量环境、变量提升和暂时性死区
  • yolov8+多算法多目标追踪+实例分割+目标检测+姿态估计(代码+教程)
  • 【神经网络】【GoogleNet】
  • 网络安全深入学习第八课——正向代理(工具:ReGeorg)
  • Jmeter全流程性能测试实战
  • Python算法例8 将整数A转换为B
  • 一个基于百度飞桨封装的.NET版本OCR工具类库 - PaddleOCRSharp
  • 在 CelebA 数据集上训练的 PyTorch 中的基本变分自动编码器
  • 利用Ansible实现批量Linux服务器安全配置
  • 读书笔记:彼得·德鲁克《认识管理》第8章 战略规划:企业家技能
  • HarmonyOS应用开发-视频播放器与弹窗
  • java中对象的引用是什么?
  • jenkins插件迁移
  • RK356X Android13.0 HDMI和喇叭同时出声音
  • vue sass-loader,webpack安装卸载操作命令
  • nacos应用——占用内存过多问题解决(JVM调优初步)
  • 大漠插件(二、Qt使用插件时注意事项)
  • CSS 浮动
  • 基于STM32+华为云IOT设计的火灾感知系统
  • 算法通关村第八关|白银|二叉树的深度和高度问题【持续更新】
  • cmake 之add_definitions使用误区
  • Leetcode—515.在每个树行中找最大值【中等】
  • 安防监控系统EasyCVR平台设备通道绑定AI算法的功能设计与开发实现
  • element 弹窗浏览器后退-遮照层还存在问题 以及跟vue keep-alive冲突
  • C++(Qt)软件调试---自动注册AeDebug(17)
  • 云原生周刊:Gateway API 1.0.0 发布 | 2023.11.6
  • Java2 - 数据结构
  • 精解括号匹配问题与极致栈设计:揭开最大栈和最小栈的奥秘
  • 云存储/视频监控管理平台EasyCVR,使用sqlite数据库出现卡顿该如何优化?
  • 实战!工作中常用的设计模式