11、JVM实战:执行引擎

*

十一、执行引擎

1、执行引擎概述

执行引擎是Java虚拟机核心的组成部分之一,虚拟机的执行引擎由软件自行实现,能够执行不被硬件直接支持的指令格式,物理机的执行引擎是操作系统层面上。

执行引擎的工作过程:

*

1、 执行引擎在执行的过程中究竟需要执行什么样的字节码指令完全依赖于PC寄存器;
2、 每当执行完一项指令操作后,PC寄存器就会更新下一条需要被执行的指令地址;
3、 当然方法在执行的过程中,执行引擎有可能会通过存储在局部变量表中的对象引用准确定位到存储在Java堆区中的对象实例信息,以及通过对象头中的元数据指针定位到目标对象的类型信息;

2、Java 代码编译和执行过程

大部分的程序代码转换成物理机的目标代码或虚拟机能执行的指令集之前,都需要经过上图中的各个步骤

*

为什么说 Java是半编译半解释型语言?

  • JVM在执行Java代码的时候,通常会将解释执行与编译执行二者结合起来进行

3、机器码,指令,汇编语言

机器码:各种采用二进制编码方式表示的指令,叫做机器指令码、机器语言。机器指令与CPU紧密相关,不同种类的CPU所对应的机器指令也就不同。

指令:

  • 由于机器码由01组成,可读性太差。于是人们发明了指令
  • 指令就是把机器码特定的0和1序列,简化成对应的指令,一般为英文编写如mov,inc等,可读性稍好
  • 由于不同的硬件平台,执行同一个操作,对应的机器码可能不同。所以不同的硬件平台的同一种指令,对应的机器码也可能不同

指令集:

  • 不同硬件平台,各自支持的指令,是有差别的。因此每个平台所支持的指令,称之为对应平台的指令集
  • x86指令集,对应的x86架构的平台
  • ARM指令集,对应的是ARM架构的平台

汇编:

  • 由于指令的可读性太差,于是又有了汇编语言
  • 汇编语言用助记符代替机器指令的操作码,用地址符号或标号,代替指令或操作数的地址。
  • 汇编语言要翻译成机器指令码,计算机才能识别和执行

*

4、解释器

*

当Java虚拟机启动时,会根据预定义的规范对字节码采用逐行解释的方式执行,将每条字节码文件中的内容翻译为对应平台的本地机器指令执行。解析器真正意义上所承担的角色就是一个运行时翻译者,将字节码文件中的内容翻译为对应的平台的本地机器指令执行。

当一条字节码指令被解释执行完成后,接着在根据PC寄存器中的记录下一条需要被执行的字节码执行解释执行。

  • 古老的字节码解释器
  • 现在普遍使用的模板解释器:将每一条字节码和一个模板函数相关联,模板函数直接产生这条字节码执行时的机器码,提高解释器的性能。

HotSpot中:

  • Interpreter模块:实现了解释器的核心功能。
  • Code模块:用于管理HotSpot在运行时生成的本地机器指令。

5、JIT 编译器

*

虚拟机将源代码直接编译成和本地机器平台相关的机器语言。

JVM平台支持一种叫做即时编译的技术,目的是避免解释执行,而是将整个函数体编译成机器码,每次函数执行时,只执行编译后的机器码即可。使执行效率大幅提升。

为什么两条腿走路?

  • 首先程序启动后,解释器可以马上发挥作用,省去编译时间,立即执行。
  • 编译器要想发挥作用,把代码编译成本地代码,需要一定的执行时间。但编译为本地代码后执行效率更高。
  • 对于服务端应用,启动时间并非关注重点,但是对于看重启动时间的应用场景,就需要找到一个平衡点。
  • 当 Java虚拟机启动时,解释器可以首先发挥作用,而不是等待即时编译器全部编译完成后再执行,这样可以省去很多不必要的编译时间,随着时间的推移,编译器发挥作用,把越来越多的代码编译成本地代码,获得更高的执行效率。

6、热点代码及探测方式

什么时候选择 JIT?

需要根据代码被调用执行的频率而定,需要被编译为本地代码的字节码,也称之为热点代码。JIT编译器会在运行时针对频繁调用的热点代码做出深度优化,将其直接编译为对应平台的本地机器指令。以此提升 Java程序的执行性能。

一个被多次调用的方法,或者一个方法体内部循环次数较多的循环体,都可以被称之为热点代码。因此可以通过 JIT编译器编译为本地机器指令,由于这种编译方法发生在方法的执行过程中,因此也被称之为栈上替换,OSR On Statck Replacement。

一个方法调用都少次才能达到标准?hotspot采用的是基于计数器的热点探测:

  • 方法调用计数器

  • 统计方法调用次数,默认阈值,Client模式下是1500次,Server模式下是10000次

  • -XX:CompileThreshold

  • 回边计数器

  • 统计循环体执行的循环次数

    *

  • 当一个方法被调用时,如果不存在已被编译过的版本,则将此方法的调用计数器+1,然后判断方法调用计数器与回边计数器之和,是否超过方法调用计数器的阈值。如果已经超过,会向即时编译器提交一个该方法的代码编译请求。

*

  • 热度衰减

  • 当超过一定的时间限度,如果方法调用次数仍然不足以提交即时编译器编译,那么这个方法的调用计数器就会被减少一半。

  • -XX:UseCounterHalfLifeTime参数设置半衰周期的时间,单位是秒

7、执行模式

hotspot可以设置程序执行的方式:

  • Xint:完全采用解释器模式执行
  • -Xcomp:完全采用即时编译器模式执行,如果即时编译器出现问题,解释器会介入执行
  • -Xmixed:采用解释器+即时编译器的混合模式共同执行
    *

hotspot中 JIT分类,内嵌两个JIT编译器,大多情况下简称C1,C2:

  • -client:指定 Java虚拟机在Client模式下,并使用C1编译器

  • C1编译器会对字节码进行简单和可靠的优化,耗时短,以达到更快的编译速度

  • 方法内联:将引用的函数代码编译到引用点处,减少栈帧的生成,减少参数传递以及跳转过程

  • 去虚拟化:对唯一的实现类进行内联

  • 冗余消除:在运行期把一些不会执行的代码折叠掉

  • -server:指定虚拟机在server模式下,并使用C2编译器

  • C2进行耗时较长的优化,以及激进优化,但优化后的代码执行效率更高

  • 逃逸分析是优化的基础,基于逃逸分析在C2上有几种优化

  • 标量替换:用标量值代替聚合对象的属性值

  • 栈上分配:对于未逃逸的对象分配在栈而不是堆

  • 同步消除:清除同步操作,通常指synchronized