05、JVM实战:虚拟机栈

*

五、虚拟机栈

1、基本内容

栈是运行时的单位,而堆是存储的单位: 栈解决程序如何执行,如何处理数据。堆解决的是数据存储问题,即数据怎么放,放在哪里。

Java虚拟机栈,早起也叫Java栈,每个线程创建时都会创建一个虚拟机栈,内部保存一个个栈帧,对应着一次次的Java方法调用。

*

  • 生命周期和线程的一致

  • 主管Java程序的运行,保存方法的局部变量(8种基本数据类型,对象的引用地址),部分结果,并参与方法的调用和返回。

  • 局部变量 vs 成员变量

  • 基本数据类型 VS 引用类型变量(类,数组,接口)

2、优点

  • 快速有效的存储方式,访问速度仅次于程序计数器

  • JVM直接对JAVA栈的操作只有两个

  • 每个方法执行,伴随着进栈(入栈,压栈)

  • 执行结束的出栈

  • 栈不存在垃圾回收,但是存在OOM、栈溢出

运行时数据区 是否存在Error 是否存在GC
程序计数器
虚拟机栈 是(SOF)
本地方法栈
方法区 是(OOM)
是(OOM)

Java栈大小是动态或者固定不变的

  • 动态扩展,无法申请到足够内存OOM
  • 如果是固定,线程请求的栈容量超过固定值,则StackOverflowError
  • 使用-Xss,MaxStackSize ,设置线程的最大栈空间

*

3、栈的存储单位

  • 每个线程都有自己的栈,栈中的数据以栈帧格式存储
  • 线程上正在执行的每个方法都各自对应一个栈帧。
  • 栈帧是一个内存区块,是一个数据集,维系着方法执行过程中的各个数据信息。
  • 一条活动的线程中,一个时间点上,只会有一个活动的栈帧。只有当前正在执行的方法的栈顶栈帧是有效的,这个称为当前栈帧,对应方法是当前方法,对应类是当前类。
  • 执行引擎运行的所有字节码指令只针对当前栈帧进行操作。
  • 如果方法中调用了其他方法,对应的新的栈帧会被创建出来,放在顶端,成为新的当前帧。

*

运行原理:

  • 不同线程中包含的栈帧不允许存在相互引用。
  • 当前方法调用了其他方法,方法返回之际,当前栈帧会传回此方法的执行结果给前一个栈帧,接着虚拟机会丢弃当前栈帧,使得前一个栈帧重新成为新的栈帧。

Java方法有两种返回方式:

1、 一种是正常的函数返回,使用return指令;
2、 另外一种是抛出异常,不管哪种方式,都会导致栈帧被弹出;

4、栈的内部结构

*

1、局部变量表

  • 定义为一个数字数组,主要用于存储方法参数,定义在方法体内部的局部变量,数据类型包括各类基本数据类型,对象引用,以及return address类型。
  • 局部变量表建立在线程的栈上,是线程私有的,因此不存在数据安全问题
  • 局部变量表容量个数,容量大小(反编译查看locals的值)是在编译期确定下来的

*

*

*

  • 局部变量表存放编译期可知的各种基本数据类型(8种),引用类型(reference),return address 类型。

局部变量表中最基本的存储单元是slot:

  • 32位占用一个slot,64位类型(long和double)占用两个slot。
  • 局部变量表中的变量只有在当前方法调用中有效,虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。
  • 方法调用结束后,随着方法栈帧的销毁,局部变量表也会随之销毁。

关于Slot的理解:

  • JVM虚拟机会为局部变量表中的每个Slot都分配一个访问索引,通过这个索引即可成功访问到局部变量表中指定的局部变量值
  • 如果当前帧是由构造方法或者实例方法创建的,那么该对象引用this,会存放在index为0的slot处,其余的参数表顺序继续排列

*

栈帧中的局部变量表中的槽位是可以重复的,如果一个局部变量过了其作用域,那么其作用域之后申明的新的局部变量就有可能会复用过期局部变量的槽位,从而达到节省资源的目的。

静态变量与局部变量对比:

变量的分类:

1、 按照数据类型分;

  • 基本数据类型
  • 引用数据类型

2、 按照声明的位置;

  • 成员变量,在使用前经历过初始化过程,具体又分为

  • 类变量(static 变量):链接的准备阶段给类变量默认赋值,初始化阶段显示赋值,即静态代码块赋值

  • 实例变量:随着对象的创建,会在堆空间分配实例变量空间,并进行默认赋值

  • 局部变量,在使用前,必须进显式赋值,否则编译不通过

在栈帧中,与性能调优关系最密切的部分,就是局部变量表,方法执行时,虚拟机使用局部变量表完成方法的传递。局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收。

2、操作数栈

Java虚拟机的解释引擎是基于栈的执行引擎,其中栈就是操作数栈。

在方法执行的过程中,根据字节码指令,往栈中写入数据或提取数据,即入栈/出栈,作用:计算过程中变量临时存储空间,保存计算过程的中间结果。

*

当一个方法刚开始执行的时候,一个新的栈帧也会随之被创建出来,这个方法的操作数栈是空的。每一个操作数栈会拥有一个明确的栈深度,用于存储数值,最大深度在编译期就定义好了。

栈中,32bit类型占用一个栈单位深度,64bit类型占用两个栈单位深度,操作数栈是通过数组实现的,但并非采用访问索引方式进行数据访问,而是只能通过标准的入栈、出栈操作完成一次数据访问。

如果被调用方法带有返回值的话,其返回值将会被压入当前栈帧的操作数栈中,并更新程序计数器中下一条需要执行的字节码指令。

(面试常问)从字节码角度分析i++和++i的区别?

  • i++:先将 i 的值加载到操作数栈,再将 i 的值加 1
  • ++i:先将 i 的值加 1,在将 i 的值加载到操作数栈

栈顶缓存技术:由于操作数是存储在内存中,频繁的进行内存读写操作影响执行速度,将栈顶元素全部缓存到物理CPU的寄存器中,依此降低对内存的读写次数,提升执行引擎的执行效率,指令更少,执行速度快。

3、动态链接

*

动态链接:指向常量池中的方法引用。

常量池、运行时常量池:常量池在字节码文件中,运行时常量池,在运行时的方法区中。

每一个栈帧内部都包含一个指向运行时常量池中该帧所属方法的引用,目的是为了支持当前方法的代码能够实现动态链接,比如invokedynamic 指令。

*

在java 源文件被编译成字节码文件中时,所有的变量、方法引用都作为符号引用,保存在class文件的常量池中。描述一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,而动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用。

4、方法返回地址

存放调用该方法时pc寄存器的值,比如A方法在指令的第11行调用B方法,此时PC寄存器为12,则栈顶的栈帧中方法返回地址保存为12,PC寄存器记录栈顶方法的指令地址0。

方法的结束分为:正常执行完成和出现未处理异常,非正常退出。无论哪种方式退出,方法退出后,都会返回该方法被调用的位置。方法正常退出时,调用者的PC计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址。异常退出的,返回地址是通过异常表来确定,栈帧中一般不会保存这部分信息。

执行引擎遇到任意一个方法返回的字节码指令(return),会有返回值传递给上层的方法调用者,简称正常完成出口。返回指令包括:

  • ireturn 返回值是boolean,byte,char,short,和int类型时使用
  • lreturn 返回值是long
  • dreturn 返回值是double
  • areturn 引用类型
  • 还有一个return指供声明为 void的方法、实例初始化方法、类和接口的初始化方法使用

本质上,方法的退出就是当前栈帧出栈的过程。此时需要恢复上层方法的局部变量表,操作数栈,将返回值压入调用者栈帧的操作数栈,设置PC寄存器值等,让调用者方法继续执行下去。正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会给他的上层调用者产生任何的返回值。

5、一些附加信息

允许携带与Java虚拟机实现相关的一些附加信息,例如对程序调试提供支持的信息。不确定有,可选情况。

6、方法的调用

静态链接:当一个字节码文件被装载进JVM内部时,如果被调用的目标方法在编译期可知,且运行时期间保持不变,这种情况下将调用方的符号引用转为直接引用的过程称为静态链接。

动态链接:如果被调用的方法无法再编译期被确定下来,只能在运行期将调用的方法的符号引用转为直接引用,这种引用转换过程具备动态性,因此被称为动态链接。

方法的绑定

绑定是一个字段、方法、或者类在符号引用被替换为直接引用的过程,仅仅发生一次。主要分为两种:

  • 早期绑定(invokespecial ):被调用的目标方法如果在编译期可知,且运行期保持不变时,即可将这个方法与所属的类型进行绑定,这样一来,由于明确了被调用的目标方法究竟是哪一个,因此也就可以使用静态链接的方式将符号引用转换为直接引用。
  • 晚期绑定(invokevirtual、invokeinterface ):被调用的方法在编译期无法被确定,只能够在程序运行期根据实际的类型绑定相关的方法。

Java中任何一个普通方法都具备虚函数的特征(运行期确认,具备晚期绑定的特点),C++中则使用关键字virtual来显式定义。如果在java程序中,不希望某个方法拥有虚函数的特征,则可以使用关键字final来标记这个方法。

虚方法和非虚方法

非虚方法:如果方法在编译期就确定了具体的调用版本,则这个版本在运行时是不可变的。这样的方法称为非虚方法,其中包括静态方法、私有方法、final方法、实例构造器和父类方法。

其他方法称为虚方法

方法的调用指令分类

普通调用指令:

  • invokestatic :调用静态方法,解析阶段确定唯一方法版本。
  • invokespecial:调用方法,私有及父类方法,解析阶段确定唯一方法版本。
  • invokevirtual:调用所有虚方法
  • invokeinterface:调用接口方法

其中invokestatic指令和invokespecial指令调用的方法称为非虚方法,其余的(final修饰的除外)称为虚方法。

动态调用指令JDK1.7新增:

  • invokedynamic:动态解析出需要调用的方法,然后执行

直到Java8的Lambda表达式的出现,invokedynamic 指令的生成,在Java中才有了直接的生成方式。

*

静态语言和动态语言的区别在于对类型的检查是编译器还是运行期,满足编译期就是静态类型语言(Java),反之就是动态类型语言(JS、Python)。Java是静态类型语言,动态调用指令增加了动态语言的特性。

方法重写的本质:

  • 找到操作数栈顶的第一个元素所执行的对象的实际类型,记做C。
  • 如果在类型C中找到与常量池中描述符和简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束,如果不通过,则返回java.lang.IllegalAccessError异常。
  • 否则,按照继承关系从下往上依次对C的各个父类进行上一步的搜索和验证过程。
  • 如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常。

虚方法表(存在方法区):

  • 面向对象的编程中,会很频繁的使用动态分配,如果每次动态分配的过程都要重新在类的方法元数据中搜索合适的目标的话,就可能影响到执行效率,因此为了提高性能,JVM采用在类的方法区建立一个虚方法表,使用索引表来代替查找。
  • 每个类都有一个虚方法表,表中存放着各个方法的实际入口。
  • 虚方法表会在类加载的链接阶段被创建,并开始初始化,类的变量初始值准备完成之后,JVM会把该类的方法也初始化完毕。

*