当前位置: 首页 > news >正文

6.1 innoDb逻辑存储结构和架构-简介

InnoDB 是 MySQL 默认的存储引擎,以其强大的事务支持、崩溃恢复能力和高效的数据处理能力广受欢迎。本文从逻辑存储结构、内存架构、磁盘结构到后台线程,逐步剖析 InnoDB 的关键概念,帮助您更好地理解和应用。


1. 逻辑存储结构

InnoDB 的数据存储采用多层次的逻辑结构,具有极高的组织性和扩展性。

  • 表空间(Tablespace):InnoDB 数据存储的最高层次,负责组织数据文件。
  • 段(Segment):表空间的子单位,分为数据段(存储表数据)、索引段(存储索引)和回滚段。
  • 区(Extent):每个段由多个区组成,每个区包含 64 个连续的页(Page)。
  • 页(Page):InnoDB 数据存储的基本单位,默认大小为 16KB。
  • 行(Row):页中实际存储的记录数据。

1.1 特点

  • 分层结构使得数据管理更高效。
  • 页大小支持调整(4KB、8KB、16KB),以适应不同场景的需求。

1.2 逻辑存储结构图

在这里插入图片描述


2. 内存架构

内存架构是 InnoDB 高性能的核心部分。以下是主要组成部分及其作用:

2.1 缓冲池(Buffer Pool)

  • 简介:缓冲池是用于缓存表数据和索引的区域,占用 InnoDB 的大部分内存。
  • 作用:
    1. 减少磁盘 I/O:将数据和索引页缓存在内存中,减少磁盘读写。
    2. 脏页管理:修改后的页(脏页)被延迟写回磁盘,提高性能。

优化建议

  • 合理设置缓冲池大小(innodb_buffer_pool_size)。

  • 查看缓冲池命中率:

    SHOW ENGINE INNODB STATUS;
    

2.2 更改缓冲区(Change Buffer)

  • 简介:缓存对非唯一二级索引的修改操作,减少随机写磁盘的次数。
  • 作用:
    • 延迟写入:对二级索引的插入、更新和删除操作先缓存在更改缓冲区,后续批量写入磁盘。
    • 提升性能:在写密集型场景下效果显著。

2.3 自适应哈希索引(Adaptive Hash Index)

  • 简介:基于热点数据动态生成的哈希索引,用于加速等值查询。
  • 作用:
    1. 提高 B+ 树索引的查询效率。
    2. 减少多层索引节点的遍历。

查询是否开启

SHOW VARIABLES LIKE '%hash_index%';

2.4 日志缓存区

  • 简介:存储事务日志的内存区域。
  • 作用:
    1. 加速事务日志写入。
    2. 支持崩溃恢复。

查看相关参数

SHOW VARIABLES LIKE '%log_buffer_size%';
SHOW VARIABLES LIKE '%flush_log%';

innodb_flush_log_at_trx_commit 值的含义

  • 1:每次事务提交时立即写入磁盘,保证数据安全。
  • 0:日志保存在内存中,性能高但数据不安全。
  • 2:日志写入 OS 缓存,周期性刷盘,性能与安全性折中。

3. 磁盘结构

InnoDB 数据持久化依赖于磁盘结构,其设计确保了高效存储和事务一致性。

3.1 系统表空间

  • 简介:存储共享元数据、Undo 数据、事务日志等。
  • 作用:管理数据库的核心元数据。

查询指令

SHOW VARIABLES LIKE '%innodb_data_file_path%';

3.2 独立表空间(File-Per-Table Tablespaces)

  • 特点:每个表单独存储在一个 .ibd 文件中。
  • 优点:
    • 更灵活的备份和迁移。
    • 减少单个表空间的碎片。

3.3 通用表空间

  • 特点:支持多个表共享一个表空间。

  • 指令:

    • 创建表空间:

      CREATE TABLESPACE ts1 ADD DATAFILE 'ts1.ibd' ENGINE=InnoDB;
      
    • 表指定表空间:

      CREATE TABLE employees (...) TABLESPACE ts1;
      

3.4 Undo 表空间

  • 作用:存储回滚信息。
  • 特点:在事务回滚和多版本并发控制(MVCC)中发挥重要作用。

3.5 临时表空间

  • 简介:存储临时表的数据,仅在会话期间有效。

3.6 双写缓冲区

  • 作用:防止写操作中断导致数据损坏。
  • 机制:
    • 数据页先写入双写缓冲区。
    • 双写缓冲区再将数据写入表空间。

3.7 Redo Log 重做日志

  • 作用:记录事务的物理变化,用于崩溃恢复。
  • 组成:
    • Redo Log Buffer:内存中的日志缓冲。
    • Redo Log File:磁盘上的日志文件。

4. 后台线程

InnoDB 依靠多个后台线程管理内存、磁盘和事务。

4.1 Master Thread

  • 作用:调度和执行主要后台任务,如脏页刷新和更改缓冲区合并。

4.2 IO Thread

  • 作用:处理磁盘 I/O 请求。
  • 分类
类型作用默认线程数量
Read Thread处理读请求(从缓冲池读取页)默认 4(可配置)
Write Thread处理写请求(刷新脏页到磁盘)默认 4(可配置)
Insert Buffer Thread合并插入缓冲区的更改1
Log Thread刷新事务日志到磁盘1

注:

  1. Read Thread 和 Write Thread
    • 数量:默认均为 4,负责处理 I/O 操作,适用于大规模的并发读写。
    • 可配置参数 :
      • innodb_read_io_threads:配置读线程数量。
      • innodb_write_io_threads:配置写线程数量。
    • 作用:这些线程负责从磁盘读取数据页(读线程)或将脏页写入磁盘(写线程)。
  2. Insert Buffer Thread
    • 数量:固定为 1,无法通过配置改变。
    • 作用:在插入数据时,合并更改到二级索引的缓冲区。
  3. Log Thread
    • 数量:固定为 1。
    • 作用:负责将事务日志从缓冲区刷新到磁盘文件(如 redo log 文件)。
    • 优化机制:
      • 使用了组提交(group commit),提高日志刷新效率。

查看引擎状态

SHOW ENGINE INNODB STATUS;

4.3 Purge Thread

  • 作用:清理不再需要的 Undo 数据,减少表空间占用。

4.4 Page Cleaner Thread

  • 作用:刷新脏页到磁盘,减少事务提交时的延迟。

通过对 InnoDB 存储引擎的深入了解,可以更有效地优化 MySQL 数据库性能,提高系统的稳定性和可靠性。

http://www.lryc.cn/news/497037.html

相关文章:

  • C++看懂并使用-----回调函数
  • 构建短视频矩阵生态体系开发分享
  • qt QGraphicsScale详解
  • CAD 文件 批量转为PDF或批量打印
  • Java基础面试题16:简述Servlet的体系结构
  • Web开发基础学习——理解React组件中的根节点
  • 【人工智能】探索自然语言生成(NLG):用GPT生成文本
  • 挑战用React封装100个组件【004】
  • vue elementui layout布局组件实现规则的弹性布局
  • SpringBoot Web 开发请求参数
  • python7学习笔记-循环、迭代、pass
  • LeetCode78:子集
  • Linux 安装scala
  • 重生之我在异世界学编程之C语言:深入指针篇(上)
  • linux centos7 yum命令失效
  • mac访达打开终端
  • 【MySQL 进阶之路】索引的使用
  • 网络编程相关 API 学习
  • python使用python-docx处理word
  • 【笔记2-1】ESP32:基于vscode的espidf插件的开发环境搭建
  • 集成网关 -- 新节点的开发说明
  • 【Gitlab】CICD使用minio作为分布式缓存
  • ️️耗时一周,肝了一个超丝滑的卡盒小程序
  • 网络安全审计
  • 论文:IoU Loss for 2D/3D Object Detection
  • 2411mfc,修改按钮颜色
  • 互联网 Java 面试八股文汇总(2025 最新整理)
  • 如何在 Ubuntu 中更新 Linux 内核
  • FilterListenerAjax
  • 27. 移除元素 C++