Java 的基本类型
AsmTools
在 OpenJDK 里有一个 AsmTools
项目,用来生成正确的或者不正确的 Java .class
文件,主要用来测试和验证。我们知道直接修改
.class文件是很麻烦的,虽然有一些图形界面的工具,但还是很麻烦。
AsmTools
引入了两种表示 .class
文件的语法:
- JASM
用类似 Java 本身的语法来定义类和函数,字节码指令则很像传统的汇编。
java -jar asmtools.jar jdis Test.class
- JCOD
整个.class
用容器的方式来表示,可以很清楚表示类文件的结构。
java -jar asmtools.jar jdec Test.class
AsmTools修改字节码
Java源码文件
public class Foo {
public static void main(String[] args) {
boolean flag = true;
if (flag) System.out.println("Hello, Java!");
if (flag == true) System.out.println("Hello, JVM!");
}
}
生成字节码文件(Foo.class)并运行
# 生成字节码文件
javac Foo.java
# 运行
java Foo
Hello, Java!
Hello, JVM!
使用 AsmTools 生成 jasm 语法格式的字节码(Foo.jasm.1)
java -cp asmtools.jar org.openjdk.asmtools.jdis.Main Foo.class > Foo.jasm.1
super public class Foo
version 52:0
{
public Method "<init>":"()V"
stack 1 locals 1
{
aload_0;
invokespecial Method java/lang/Object."<init>":"()V";
return;
}
public static Method main:"([Ljava/lang/String;)V"
stack 2 locals 2
{
iconst_1;
istore_1;
iload_1;
ifeq L14;
getstatic Field java/lang/System.out:"Ljava/io/PrintStream;";
ldc String "Hello, Java!";
invokevirtual Method java/io/PrintStream.println:"(Ljava/lang/String;)V";
L14: stack_frame_type append;
locals_map int;
iload_1;
iconst_1;
if_icmpne L27;
getstatic Field java/lang/System.out:"Ljava/io/PrintStream;";
ldc String "Hello, JVM!";
invokevirtual Method java/io/PrintStream.println:"(Ljava/lang/String;)V";
L27: stack_frame_type same;
return;
}
} // end Class Foo
使用 awk 正则将 iconst_1 换成 iconst_2 ( Foo.jasm)
awk 'NR==1,/iconst_1/{sub(/iconst_1/, "iconst_2")} 1' Foo.jasm.1 > Foo.jasm
super public class Foo
version 52:0
{
public Method "<init>":"()V"
stack 1 locals 1
{
aload_0;
invokespecial Method java/lang/Object."<init>":"()V";
return;
}
public static Method main:"([Ljava/lang/String;)V"
stack 2 locals 2
{
iconst_2;
istore_1;
iload_1;
ifeq L14;
getstatic Field java/lang/System.out:"Ljava/io/PrintStream;";
ldc String "Hello, Java!";
invokevirtual Method java/io/PrintStream.println:"(Ljava/lang/String;)V";
L14: stack_frame_type append;
locals_map int;
iload_1;
iconst_1;
if_icmpne L27;
getstatic Field java/lang/System.out:"Ljava/io/PrintStream;";
ldc String "Hello, JVM!";
invokevirtual Method java/io/PrintStream.println:"(Ljava/lang/String;)V";
L27: stack_frame_type same;
return;
}
} // end Class Foo
jasm 语法格式 转换成class 文件 (Foo.class)
java -cp asmtools.jar org.openjdk.asmtools.jasm.Main Foo.jasm
运行字节码文件
Java Foo
Hello, Java!
分析
**boolean 类型在 Java 虚拟机中被映射为整数类型:“true”被映射为 1,而“false”被映射为 0。**Java 代码中的逻辑运算以及条件跳转,都是用整数相关的字节码来实现的。
* flag = iconst_1 = true
* if(flag)比较时 ifeq 指令做是否为零判断,常数 2 仍为 true,打印输出
* if(true == flag)比较时 if_cmpne 做整数比较,iconst_1(iconst_2) 是否等于 flag,比较失败,不再打印输出
基本类型优于对象类型
Java 引进了八个基本类型,来支持数值计算。Java 这么做的原因主要是工程上的考虑,因为使用基本类型能够在执行效率以及内存使用两方面提升软件性能。
Java 语言规范中的 boolean
在 Java 语言规范中,boolean 类型的值只有两种可能,它们分别用符号“true”和“false”来表示。显然,这两个符号是不能被虚拟机直接使用的。
Java 虚拟机规范中的 boolean
在 Java 虚拟机规范中,boolean 类型则被映射成 int 类型。具体来说,“true”被映射为整数 1,而“false”被映射为整数 0。这个编码规则约束了 Java 字节码的具体实现。
对于 Java 虚拟机来说,它看到的 boolean 类型,早已被映射为整数类型。因此,将原本声明为 boolean 类型的局部变量,赋值为除了 0、1 之外的整数值,在 Java 虚拟机看来是“合法”的。
Java 的基本类型
Java 的基本类型都有对应的值域和默认值。可以看到,byte、short、int、long、float 以及 double 的值域依次扩大,而且前面的值域被后面的值域所包含。因此,从前面的基本类型转换至后面的基本类型,无需强制转换。另外一点值得注意的是,尽管他们的默认值看起来不一样,但在内存中都是 0。
基本类型在栈中的表现
在 Java 虚拟机规范中,局部变量区等价于一个数组,并且可以用正整数来索引。除了 long、double 值需要用两个数组单元来存储之外,其他基本类型以及引用类型的值均占用一个数组单元。因此,在 32 位的 HotSpot 中,这些类型在栈上将占用 4 个字节;而在 64 位的 HotSpot 中,他们将占 8 个字节。
也就是说,boolean、byte、char、short 这四种类型,在栈上占用的空间和 int 是一样的,和引用类型也是一样的。变长数组不好控制,所以就选择浪费一些空间,以便访问时直接通过下标来计算地址。
基本类型在堆中表现
对于 byte、char 以及 short 这三种类型的字段或者数组单元,它们在堆上占用的空间分别为一字节、两字节,以及两字节,也就是说,跟这些类型的值域相吻合。
掩码操作
在将 boolean、byte、char 以及 short 的值存入字段或者数组单元时,Java 虚拟机会进行掩码操作。在读取时,Java 虚拟机则会将其扩展为 int 类型。