当前位置: 首页 > news >正文

详解Java的类文件结构(.class文件的结构)

 

  • this_class 指向常量池中索引为 2 的 CONSTANT_Class_info。
  • super_class 指向常量池中索引为 3 的 CONSTANT_Class_info。
  • 由于没有接口,所以 interfaces 的信息为空。

对应 class 文件中的位置如下图所示。

 

06、字段表

一个类中定义的字段会被存储在字段表(fields)中,包括静态的和非静态的。

来看这样一段代码。

public class FieldsTest {private String name;
}

字段只有一个,修饰符为 private,类型为 String,字段名为 name。可以用下面的伪代码来表示 field 的结构。

field_info {u2 access_flag;u2 name_index;u2 description_index;
}
  • access_flag 为字段的访问标记,比如说是不是 public | private | protected,是不是 static,是不是 final 等。
  • name_index 为字段名的索引,指向常量池中的 CONSTANT_Utf8_info, 比如说上例中的值就为 name。
  • description_index 为字段的描述类型索引,也指向常量池中的 CONSTANT_Utf8_info,针对不同的数据类型,会有不同规则的描述信息。

1)对于基本数据类型来说,使用一个字符来表示,比如说 I 对应的是 int,B 对应的是 byte。

2)对于引用数据类型来说,使用 L***; 的方式来表示,L 开头,; 结束,比如字符串类型为 Ljava/lang/String;

3)对于数组来说,会用一个前置的 [ 来表示,比如说字符串数组为 [Ljava/lang/String;

对应到 class 文件中的位置如下图所示。

 

看到这里相信你就能明白经常在 javap 命令中看到的一些奇怪的字符的意思了。

07、方法表

方法表和字段表类似,区别是用来存储方法的信息,包括方法名,方法的参数,方法的签名。

就拿 main 方法来说吧。

public class MethodsTest {public static void main(String[] args) {}
}

先用 jclasslib 看一下大概的信息。

 

  • 访问标记是 public static 的。
  • 方法名为 main。
  • 方法的参数为字符串数组;返回类型为 Void。

对应到 class 文件中的位置如下图所示。

 

08、属性表

属性表是 class 文件中的最后一部分,通常出现在字段和方法中。

来看这样一段代码。

public class AttributeTest {public static final int DEFAULT_SIZE = 128;
}

只有一个常量 DEFAULT_SIZE,它属于字段中的一种,就是加了 final 的静态变量。先通过 jclasslib 看一下它当中一个很重要的属性——ConstantValue,用来表示静态变量的初始值。

 

  • Attribute name index 指向常量池中值为“ConstantValue”的常量。
  • Attribute length 的值为固定的 2,因为索引只占两个字节的大小。
  • Constant value index 指向常量池中具体的常量,如果常量类型为 int,指向的就是 CONSTANT_Integer_info。

我画了一副图,可以完整的表示字段的结构,包含属性表在内。

 

对应到 class 文件中的位置如下图所示。

来看下面这段代码。

public class MethodCode {public static void main(String[] args) {foo();}private static void foo() {}
}

main 方法中调用了 foo 方法。通过 jclasslib 看一下它当中一个很重要的属性——Code, 方法的关键信息都存储在里面。

 

  • Attribute name index 指向常量池中值为“Code”的常量。
  • Attribute length 为属性值的长度大小。
  • bytecode 存储真正的字节码指令。
  • exception table 表示方法内部的异常信息。
  • maximum stack size 表示操作数栈的最大深度,方法执行的任意期间操作数栈深度都不会超过这个值。
  • maximum local variable 表示临时变量表的大小,注意,并不等于方法中所有临时变量的数量之和,当一个作用域结束,内部的临时变量占用的位置就会被替换掉。
  • code length 表示字节码指令的长度。

对应 class 文件中的位置如下图所示。

 

09、QA

评论区有读者问到:“怎么通过索引值,定位到在class 文件中的位置,这个是咋算的?”

在Java类文件中,常量池是一个索引表,它从索引值1开始计数,每个条目都有一个唯一的索引。

  • 常量池计数器:在常量池之前,类文件有一个16位的常量池计数器,表示常量池中有多少项。它的值比实际常量数大1(因为索引从1开始)。
  • 常量池条目:每个常量池条目的开始是一个标签(1个字节),表明了常量的类型(如Class、Fieldref、Methodref等)。根据这个类型,后面跟着的数据结构也不同。

定位过程大致如下:

  • 读取常量池计数器:首先,从类文件的开头读取常量池计数器的值,确定常量池中有多少条目。
  • 遍历常量池:从常量池的第一项开始遍历。由于不同类型的常量长度不同,需要根据每个常量的类型来确定它的长度。
  • 根据索引定位:继续遍历,直到到达所需的索引值。每次遍历时,根据条目类型读取相应长度的数据,直到达到目标索引。

可以抽象成一个数组和一个 for 循环,就能明白了。

int[] constantPool = new int[constantPoolCount];
for (int i = 1; i < constantPoolCount; i++) {int tag = constantPool[i];switch (tag) {case CONSTANT_Integer_info:i += 4;break;case CONSTANT_Float_info:i += 4;break;case CONSTANT_Long_info:i += 8;break;case CONSTANT_Double_info:i += 8;break;case CONSTANT_Utf8_info:int length = constantPool[i + 1];i += length + 1;break;case CONSTANT_String_info:i += 2;break;case CONSTANT_Class_info:i += 2;break;case CONSTANT_Fieldref_info:i += 4;break;case CONSTANT_Methodref_info:i += 4;break;case CONSTANT_InterfaceMethodref_info:i += 4;break;case CONSTANT_NameAndType_info:i += 4;break;case CONSTANT_MethodHandle_info:i += 3;break;case CONSTANT_MethodType_info:i += 2;break;case CONSTANT_InvokeDynamic_info:i += 4;break;default:throw new RuntimeException("Unknown tag: " + tag);}
}

10、小结

到此为止,class 文件的内部算是剖析得差不多了,希望能对大家有所帮助。第一次拿刀,手有点颤,如果哪里有不足的地方,欢迎大家在评论区毫不留情地指出来!

  • class 文件是一串连续的二进制,由 0 和 1 组成,但我们仍然可以借助一些工具来看清楚它的真面目。
  • class 文件的内容通常可以分为下面这几部分,魔数、版本号、常量池、访问标记、类索引、父类索引、接口索引、字段表、方法表、属性表。
  • 常量池包含了类、接口、字段和方法的符号引用,以及字符串字面量和数值常量。
  • 访问标记用于识别类或接口的访问信息,比如说是不是 public | private | protected,是不是 static,是不是 final 等。
  • 类索引、父类索引和接口索引用来确定类的继承关系。
  • 字段表用来存储字段的信息,包括字段名,字段的参数,字段的签名。
  • 方法表用来存储方法的信息,包括方法名,方法的参数,方法的签名。
  • 属性表用来存储属性的信息,包括字段的初始值,方法的字节码指令等。

相信大家看完这篇内容应该能对 class 文件有一个比较清晰的认识了。

http://www.lryc.cn/news/467838.html

相关文章:

  • 爆肝整理14天!AI工具宝藏合集
  • 高效库存管理:金蝶云星空与管易云的盘亏单对接方案
  • 小鹏汽车股价分析:看涨信号已出现,技术指标显示还有40%的上涨空间
  • c语言指针详解2
  • Chrome DevTools 二: Performance 性能面板
  • 渠道推广如何识别与防止虚假流量?
  • Keil C51 9.61__官网“最新版“下载、安装及相关提示( 保姆级教程, 安装过程详解, 附安装包 )
  • 二进制搭建 Kubernetes v1.20
  • 我希望,你把篮球和鸡联系起来想一想。。。
  • STM32 ADC介绍
  • JavaWeb合集12-Redis
  • 【C++】在Windows中使用Boost库——实现TCP、UDP通信
  • 怎么提取pdf的某一页?批量提取pdf的某一页的简单方法
  • Github优质项目推荐(第八期)
  • 快读快写模板
  • make_blobs函数
  • 特斯拉Optimus:展望智能生活新篇章
  • 基于Leaflet和SpringBoot的全球国家综合检索WebGIS可视化
  • 【Linux】/usr/share目录
  • Java中如何应用序列化 serialVersionUID 版本号呢?
  • 面部识别技术:AI 如何识别人脸
  • 全面解析文档对象模型(DOM)及其操作(DOM的概念与结构、操作DOM节点、描述DOM树的形成过程、用DOMParser解析字符串为DOM对象)
  • 字符串使用方法:
  • 想让前后端交互更轻松?alovajs了解一下?
  • E/MicroMsg.SDK.WXMediaMessage:checkArgs fail,thumbData is invalid 图片资源太大导致分享失败
  • No.21 笔记 | WEB安全 - 任意文件绕过详解 part 3
  • 咸鱼自动发货 免费无需授权
  • Netty核心组件
  • Windows中如何安装SSH
  • 在linux上部署ollama+open-webu,且局域网访问教程