一、JVM是什么:
Java Virtual Machine,Java的运行环境(java二进制字节码的运行环境);一次编写、到处运行;自动管理内存,提供垃圾回收机制
JVM的组成部分、运行流程:
二、JVM的组成:
1.程序计数器:
程序计数器是线程私有的,内部保存的字节码行号,用于记录正在执行的字节码指令的地址
2.JAVA堆
Java堆是线程共享的区域:主要用来保存对象实例,数组等;当堆中没有内存空间可以分配给实例也无法再扩展时,则抛出OutOfMemoryError异常
Java8中Java堆由年轻代和老年代组成,其中年轻代被划分为三部分,分别是Eden区和两个大小严格相同的Survivor区,老年代主要保存生命周期长的对象,一般是一些老的对象
Java1.7中有一个永久代,存储的是类信息、静态变量、常量以及编译后的代码
Java1.8移除了永久代,把数据存储到了本地内存的元空间中,防止内存溢出
3.虚拟机栈:
Java Virtual Machine Stacks(JAVA虚拟机栈):
每个线程运行时所需要的内存,称为虚拟机栈,先进后出
每个栈由多个栈帧组成,对应着每次方法调用时所占用的内存
每个线程只能有一个活动栈帧,对应着当前正在执行的那个方法
垃圾回收是否涉及栈内存:
垃圾回收主要指的就是堆内存,当栈帧弹出后,内存就会释放
栈内存分配越大越好吗:
未必,默认的栈内存通常为1024K,栈帧过大会导致线程数变少,机器总内存为512M,目前能活动的线程数则为512个,如果把栈内存改为2048K,那么能活动的栈帧就会减半
方法内的局部变量是否线程安全:
如果方法内的局部变量没有逃离方法的作用范围,它是线程安全的,如果是局部变量引用了对象,并逃离方法的作用范围,需要考虑线程安全
栈内存溢出的情况:
栈帧过多导致栈内存溢出、栈帧过大导致栈内存溢出
堆栈的区别是什么:
栈内存一般会用来存储局部变量和方法调用,但是堆内存是用来存储Java对象和数组的,堆会GC垃圾回收,而栈不会
栈内存是线程私有的,而堆内存是线程共有的
两者异常错误不同,但是如果栈内存或堆内存不足都会抛出异常:
栈空间不足:java.lang.StackOverFlowError
堆空间不足:java.lang.OutOfMemoryError
4.能不能解释一下方法区:
方法区(MethodArea)是各个线程共享的内存区域
主要存储类的信息、运行时常量池
虚拟器启动时创建,关闭时释放
如果方法区域中的内存无法满足分配请求,则会抛出OutOfMemoryError:MetaSpace
常量池
可以看做是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型以及字面量等信息
运行时常量池:
常量池是*.class文件中的,当该类被加载,它的常量池信息就会放入运行时常量池,并把里面的符号地址变为真实地址
5.直接内存:
直接内存并不属于JVM中的内存结构,不由JVM进行管理,是虚拟机的系统内存,常见于NIO操作时用于数据缓冲区,分配回收成本较高,但是读写性能较高,不受JVM内存回收管理
常规IO的数据拷贝流程:
NIO数据拷贝流程:
6.什么是类加载器,类加载器有哪些?
类加载器:
JVM只会运行二进制文件,类加载器的作用就是将字节码文件加载到JVM中,从而让Java程序能够启动起来
类加载器的分类:
(1).启动类加载器(BootStrap ClassLoader):加载JAVA_HOME/jre/lib目录下的库
(2).扩展类加载器(ExtClassLoader):主要加载JAVA_HOME/jre/lib/ext目录中的类
(3).应用类加载器(AppClassLoader):用于加载classPath下的类
(4).自定义类加载器(CustomizeClassLoader):自定义类继承ClassLoader,实现自定义类加载规则
双亲委派模型:
加载某一个类,先委托上一级的加载器进行加载,如果上级加载器也有上级,则会继续向上委托,如果该类委托上级没有被加载,则子加载器尝试加载该类
JVM为什么要采用双亲委派机制:
(1).通过双亲委派机制可以避免某一个类被重复加载,当父类已经加载后则无需重复加载,保证唯一性
(2).为了安全,保证类库API不会被修改
7.类装载的执行过程:
类从加载到虚拟机中开始,直到卸载为止,它的生命周期包括了加载、验证、准备、解析、初始化、使用和卸载7个阶段,其中验证、准备和解析这三个部分统称为连接(linking)
(1).加载阶段:
通过类的全名,获取类的二进制数据流
解析类的二进制数据流为方法区内的数据结构
创建java.lang.Class类的实例,表示该类型。作为方法区这个类的各种数据的访问入口
(2).验证阶段:
验证类是否符合JVM规范,安全性检测。
包括文件格式验证、元数据验证、字节码验证、符号引用验证。前三验证主要是格式检查,判断文件格式是否错误、语法是否错误以及字节码是否合格;最后一个验证主要是Class文件在其常量池会通过字符串记录自己将要使用的其他类或方法,检查他们是否存在
(3).准备阶段:
为类变量分配内存并设置类变量和初始值
static变量:分配空间在准备阶段完成,赋值在初始化阶段完成
static变量是final的基本类型,以及字符串常量,值已经确定,赋值在准备阶段完成
static变量时final的引用类型,那么赋值也会在初始化阶段完成
(4).解析阶段:
把类中的符号引用转换为直接引用
例如:方法中调用了其他方法,方法名可以理解为符号引用,而直接引用就是使用指针直接指向方法
(5).初始化阶段:
对类的静态变量,静态代码块执行初始化操作
如果初始化一个类的时候,其父类尚未初始化,则优先初始化其父类
如果同时包含多个静态变量和静态代码块,则按照自上而下的顺序依次执行
(6).使用阶段:
JVM开始从入口方法开始执行用户的程序代码
调用静态类成员信息,使用new关键字为其创建对象实例
(7).卸载阶段:
当用户程序代码执行完毕后,JVM便开始销毁创建的Class对象
8.对象什么时候可以被垃圾器回收:
如果一个或多个对象没有任何的引用指向它了,那么这个对象现在就是垃圾,如果定位了垃圾,则有可能会被垃圾回收器回收
要定位什么是垃圾,有两种方式,第一个是引用计数法,第二个是可达性分析算法
(1).引用计数法:
一个对象被引用了一次,在当前的对象头上递增一次引用次数,如果这个对象的引用次数为0,代表这个对象可回收
当对象间出现了循环引用的话,则引用计数法则会失效,会引发内存泄漏
(2).可达性分析算法:
现在的虚拟机采用的都是通过可达性分析算法来确定哪些内容是垃圾
哪些对象可以作为GC Root:
虚拟机栈(栈帧中的本地变量表)中引用的对象
方法区中类静态属性引用的对象
方法区中常量引用的对象
本地方法栈中JNI引用的对象
9.JVM垃圾回收算法有哪些?
(1).标记清除算法:
标记清除算法是将垃圾回收分为两个阶段,分别是标记和清除
a.根据可达性分析算法得出的垃圾进行标记
b.对这些标记为可回收的内容进行垃圾回收
(2).标记整理算法:
与标记清除算法一样,将存活对象都向内存另一端移动,然后清理边界以外的垃圾,无碎片,对象需要移动,效率低
(3).复制算法:
将原有的内存空间一分为二,每次只用其中的一块,正在使用的对象复制到另一个内存空间中,然后将该内存空间清空,交换两个内存的角色,完成垃圾的回收,无碎片,内存使用率较低
10.JVM中的分代回收:
分代收集算法:
在Java8中,堆被分成为两份:新生代和老年代(1:2)
分代收集算法工作机制:
a.新创建的对象,都会先分配到eden区
b.当伊甸园内存不足,标记伊甸园与 from(现阶段没有)的存活对象
c.将存活对象采用复制算法复制到to中,复制完毕后,伊甸园和from内存都得到释放
d.经过一段时间后伊甸园的内存又出现不足,标记eden区域to区存活的对象,将存活的对象复制到from区
e.当幸存区对象熬过几次回收(最多15次),晋升到老年代(幸存区内存不足或大对象会导致提前晋升)
名词解释:
a.MinorGC:发生在新生代的垃圾回收,暂停时间短(STW)
b.Mixed GC:新生代+老年代部分区域的垃圾回收,G1收集器持有
c.FullGC:新生代+老年代完整垃圾回收,暂停时间长(STW),应尽量避免
d.STW:暂停所有应用程序线程,等待垃圾回收的完成
11.JVM中的垃圾回收器:
(1).串行垃圾收集器:
Serial和Serial Old串行垃圾收集器,是指使用单线程进行垃圾回收,堆内存较小,适合个人电脑
Serial:作用于新生代,采用复制算法
Serial Old:作用于老年代,采用标记-整理算法
垃圾回收时,只有一个线程在工作,并且java应用中的所有线程都要暂停,等待垃圾回收的完成
(2).并行垃圾回收器:
Parallel New和Parallel Old是一个并行垃圾回收器,JDK8默认使用此垃圾回收器
Parallel New作用于新生代,采用复制算法
Parallel Old作用于老年代,采用标记-整理算法
垃圾回收时,多个线程在工作,并且java引用中的所有线程都要暂停,等待垃圾回收的完成
(3).CMS并发垃圾回收器
CMS全称Concurrent Mark Sweep,是一款并发的、使用标记-清除算法的垃圾回收器,该回收器是针对老年代垃圾回收的,是一款以获取最短回收停顿时间为目标的收集器,停顿时间短,用户体验就好。其最大特点是在进行垃圾回收时,应用仍然能正常运行。
(4).G1垃圾回收器
应用于新生代和老年代,在JDK9以后默认使用G1
划分成多个区域,每个区域都可以充当eden,survivor,old,humongous,其中humongous专为大对象准备
采用复制算法
响应时间与吞吐量兼顾
分成三个阶段:新生代回收、并发标记、混合收集
如果并发失败,会触发Full GC
Young Collection(年轻代垃圾回收):
初始时所有区域都处于空闲阶段
创建了一些对象,挑出一些空闲区域作为伊甸园区存储这些对象
当伊甸园需要垃圾回收时,挑出一个空闲区域作为幸存区,用复制算法复制存活对象,需要暂停用户线程
随着时间的流逝,伊甸园区的内存又会出现不足,将伊甸园以及之前幸存区中存活的对象,采用复制算法,复制到新的幸存区,其中较老对象晋升至老年代
Young Collection+Concurrent Mark(年轻代垃圾回收+并发标记):
当老年代占用内存超过阈值(默认是45%)后,触发并发标记,这时无需暂停用户线程
并发标记之后,会有重新标记阶段解决漏标问题,此时需要暂停用户线程
这些都完成之后就知道了老年代有哪些存活对象,随后进入混合收集阶段,此时不会对所有老年代区域进行回收,而是根据暂停时间目标优先回收价值高的区域
Mixed Collection(混合垃圾回收):
混合收集阶段中,参与复制的有eden,survivor,old
复制完成,内存得到释放,进入下一轮的新生代回收、并发标记、混合收集
12.强引用、软引用、弱引用和虚引用的区别:
(1).强引用:只有所有GC Roots对象都不通过强引用引用该对象,该对象才能被垃圾回收
(2).软引用:仅有软引用引用该对象时,在垃圾回收后,内存仍不足时会再次触发垃圾回收
(3).弱引用:仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象
(4).虚引用:必须配合引用队列使用,被引用对象回收时,会将虚引用入队,由ReferenceHandler线程调用虚引用相关方法释放直接内存
13.JVM调优参数可以在哪里设置参数值:
war包部署在tomcat中设置:
修改TOMCAT_HOME/bin/catalina.sh文件
jar包部署在启动参数设置:
通常在linux系统下直接加参数启动springboot项目
nohup:用于在系统后台不挂断地运行命令,退出中断不会影响程序的运行
参数&:让命令在后台执行,终端退出后命令仍旧执行
14.JVM调优的参数都有哪些?
对于JVM调优,主要就是调整年轻代、老年代、元空间的内存空间大小以及使用的垃圾回收器类型
设置堆空间大小:
设置堆的初始大小和最大大小,为了防止垃圾收集器在初始大小、最大大小之间收缩堆而产生额外的时间,通常把最大、初始大小设置为相同的值
最大大小的默认值是物理内存的1/4,初始大小是物理内存的1/64
堆太小,可能会频繁的导致年轻代和老年代的垃圾回收,产生stw,暂停用户线程
堆内存大肯定是好的,但是也存在风险。例如发生了fullgc,它会扫描整个堆空间,暂停用户线程的时间长
虚拟机栈的设置:
每个线程会默认开启1M的内存,用于存放栈帧,调用参数,局部变量等。但一般256K就够用。通常减小每个线程的堆栈,可以产生更多的线程,但这实际上还受限于操作系统
年轻代中Eden区和两个Survivor区的大小比例:
设置年轻代中Eden区和两个Survivor区的大小比例,该值如果不设置,默认比例为8:1:1,通过增大Eden区的大小来减少YGC发生的次数,但是有时候虽然次数减少了,但Eden区满的时候,由于占用的空间较大,导致释放缓慢,此时STW的时间较长,因此需要按照程序情况去调优
年轻代晋升老年代阈值:
设置垃圾回收收集器:
通过增大吞吐量提高系统性能,可以通过设置并行垃圾回收收集器
15.JVM调优工具:
(1).命令工具:
jps:进程状态信息
jstack:查看java进程内线程的堆栈信息
jmap:查看堆栈信息,用于生成堆转内存快照、内存使用情况
它是一个进程或系统在某一给定的时间的快照。比如在进程崩溃时,甚至是任何时候都可以通过工具将系统或某进程的内存备份出来供调试分析用。dump文件中包含了程序运行的模块信息、线程信息、堆栈调用信息、异常信息等数据,方便系统技术人员进行错误排查,
jhat:堆转储快照分析工具
jstat:JVM统计监测工具
(2).可视化工具:
jconsole:用于对jvm的内存,线程,类的监控,是一个基于jmx的GUI性能监控工具。在java安装目录bin目录下直接启动jconsole.exe就行
VisualVM:能够监控线程,内存情况,查看方法的CPU时间和内存中的对象,已经被GC的对象,反向查看分配的堆栈。在java安装目录bin目录下直接启动jvisualvm.exe就行
16.Java内存泄露排查思路:
(1).获取堆内存快照dump
(2).VisualVM去分析dump文件
(3).通过查看堆信息的情况,定义内存溢出的问题
16.CPU飙高排查方案与思路:
(1).使用top命令查看cpu占用情况
(2).通过top命令查看后,可以查看是哪一个进程占用cpu较高
(3).使用ps命令查看进程中的线程信息
(4).使用jstack命令可以根据线程id找到有问题的线程,进一步定位到问题代码的源码行号