当前位置: 首页 > news >正文

Linux---进程(5)---进程地址空间

目录

预备知识

进程地址空间

什么是进程地址空间

为什么要存在进程地址空间和页表

缺页中断


预备知识

我们在学习语言的时候,一般都会了解到内存区域划分,下面了解一下Linux的内存区域划分。

 通过上图,我们了解到

1、堆区向上增长,栈区向下增长

2、环境变量和命令行参数,无论是表还是内容,都在栈区的上面。

3、先有命令行参数表,再有环境变量。

在Linux中,每次打印的地址都一样,windows每次访问地址都是随机的。而Linux是一样的。

静态变量只初始化一次(默认初始化)并不随函数的调用而释放,一般在初始化数据区域中。

从系统的角度来看,语言中定义的静态变量(不论是全局还是局部)已经是全局变量了,只是局部的静态变量受到作用域限制,本质上程序运行期间一直存在的,因为程序运行期间,代码和数据会一直伴随着。

进程地址空间

我们来看一个现象:

同一个地址,通过不同进程去访问得到两个不同的值。

说明这个地址是虚拟地址(线性地址)而非物理地址。

编程语言中的地址都是虚拟地址

我们在学习语言时了解到的内存分区实际上不是内存,而是进程地址空间

每一个进程都要有进程地址空间。

程序变为进程后,每一个进程都有进程地址空间,与语言无关。所有编译型语言都必须符合此规则(每个进程都要有进程地址空间)。

首先,我们解决一下这个问题:

通过研究发现,每一个进程在创建的时候,操作系统都要为其维护一个专属的进程地址空间,再通过一种哈希映射的思想维护一张表,用来将操作系统从进程处拿到的虚拟地址转化为物理地址,再通过物理地址去访问数据。

这样的设计方式,也可以解释为什么fork创建子进程后,为什么返回值可以让父子进程不同,本质是父子进程各自的映射表中,将同一个虚拟地址映射到两个不同的物理内存中去。

进程=task_struct+代码和数据

task_struct是每个进程独有的,代码是只读的,数据修改时可以写时拷贝,所以,进程是独立的。

什么是进程地址空间

进程地址空间本质就是特定的内核数据结构对象。

每一个进程都会拥有一个进程地址空间。

在32位操作系统下,进程地址空间的大小是[0,4GB]。

操作系统通过"先描述,再组织"的方式管理进程的地址空间。

进程地址空间本质就是数据结构节点,Linux中此节点名称为mm_struct。

mm_struct中记录该进程地址空间的字段,通过这些字段来做区域划分,管理每个区域的变化。

区域内的各个地址空间都可以使用。

代码和数据都存储在物理内存中,进程地址空间中的都是虚拟地址。

上述图中的哈希映射表称之为页表。

一个程序要运行时,首先创建PCB,处理好PCB内部信息,比如pid、优先级、进程地址空间。然后将代码和数据加载到内存中,操作系统要访问数据时,通过该进程的进程地址空间拿到虚拟地址,利用页表将虚拟地址转化为物理地址,通过物理地址拿到数据

其中,CPU内部的CR3寄存器存储页表的物理地址,MMU硬件单元管理着整个映射地址、转换地址的工作。

为什么要存在进程地址空间和页表

1、将物理内存从无序变为有序,让进程以统一的视角看待内存。

2、将进程管理和内存管理解耦合

3、进程地址空间和页表组合的设计是保护内存安全的重要手段。

磁盘将可执行程序加载到内存中数据是不连续的。如果操作系统直接管理不连续的物理地址效率很低。所以我们将这个程序对应页表的虚拟地址设计成连续的,连续的虚拟地址映射到不连续的物理地址上进程管理与内存管理之间没有关系,操作系统通过页表将虚拟-物理地址相互联系,所以我们管理连续的虚拟地址就管理了物理地址,提高了效率。

进程访问数据时,页表会帮我们检测访问数据地址的合法性,如果不合法或者转化物理地址失败,操作系统就会将此进程拦截,阻止该进程,甚至终止该进程。如:一旦访问野指针或越界,操作系统会终止该进程。但终止该进程不会影响到其他进程,因为是进程自己的页表拦截了自己。所以,页表不仅仅有地址转化的工作,还有检测访问合法地址的机制。

缺页中断

我们申请内存时,可能刚申请完的内存不立即使用,如果存在这种情况,从我们申请成功到真正使用内存的这一段时间里,操作系统就不好管理这部分内存,毕竟是用户的,也不可能销毁,但是用户如果一直不用,操作系统是无法对这部分内存做处理的,操作系统的效率就会降低。

操作系统基于效率考虑,设计了以下机制

用户在申请内存后,操作系统首先在该进程的进程地址空间中的对应区域上面申请空间,然后返回给用户一个虚拟地址,等到用户真正要使用这部分内存时,操作系统首先会在页表中去查询,若页表中没有该虚拟地址与物理地址的映射关系时,操作系统就会先中断用户使用该进程的操作,在物理地址上面先申请空间,在页表中添加虚拟地址与物理地址的映射关系。再启动该用户使用内存操作,操作系统继续访问页表,通过页表映射关系找到物理内存,然后操作系统为用户执行对应操作即可。这个中断操作称为缺页中断

此机制保证了内存的使用率,提升malloc/new的速度。

http://www.lryc.cn/news/421087.html

相关文章:

  • C语言实现数据结构之队列
  • 写一个Vue2和vue3的自定义指令(以复制指定作为示例)
  • MySQL —— 聚合查询,分组查询 与 联合查询
  • Spring声明式事务失效场景
  • 基于SpringBoot+UniAPP宠物食品外卖点单小程序的设计与实现》
  • ssrf 内网访问 伪协议 读取文件 端口扫描
  • 发布包到npm
  • Python | Leetcode Python题解之第324题摆动排序II
  • IGModel——提高基于 GNN与Attention 机制的方法在药物发现中的实用性
  • AArch64中的寄存器
  • 树莓派Pico 2来了
  • LeetCode面试题Day7|LeetCode135 分发糖果、LeetCode42 接雨水
  • [免费]适用于 Windows 10 的十大数据恢复软件
  • Win11+docker+vscode配置anomalib并训练自己的数据(3)
  • Java | Leetcode Java题解之第332题重新安排行程
  • 招聘公告|健安环保科技(广东)有限公司
  • 小程序的安全设计
  • 【Android】网络技术知识总结之WebView,HttpURLConnection,OKHttp,XML的pull解析方式
  • Kubernetes—k8s集群存储卷(pvc存储卷)
  • 用网格大师转换的3D Tiles数据,在进行了顶点重建后,尝试加载到Cesium中却无法显示内容。应该如何解决这一问题?
  • display:flex布局,最简单的案例
  • SQL注入实例(sqli-labs/less-17)
  • HTML+CSS+JS计算器
  • EasyCVR视频汇聚平台云计算技术核心优势:高效、灵活与可扩展性深度解读
  • JavaScript高阶笔记总结(Xmind格式):第一天
  • 十三、代理模式
  • Unity物理模块 之 2D效应器
  • 一款手机壳凭什么卖800元?Casetify品牌策略全解析 | 品牌出海
  • 【Rust光年纪】并发编程利器:探索 Rust 异步库与并行处理工具
  • 机器学习第一课