Java 虚拟机(JVM)的垃圾收集(Garbage Collection,GC)算法有多种,每种算法都有其自身的优缺点,适用于不同的场景。以下是几种常见的垃圾收集算法及其优缺点:
1. 标记-清除算法 (Mark-Sweep):
- 原理:
- 标记 (Mark): 从 GC Roots 开始,递归地标记所有可达对象。
- 清除 (Sweep): 遍历整个堆,清除未被标记的对象(垃圾对象),释放其占用的内存。
- 优点:
- 实现简单: 算法思路比较简单。
- 不需要移动对象: 清除阶段不需要移动对象,减少了开销。
- 缺点:
- 产生内存碎片: 清除后会产生大量不连续的内存碎片,导致分配较大对象时可能需要提前触发 GC。
- 效率问题: 标记和清除两个过程的效率都比较低。
2. 复制算法 (Copying):
- 原理:
- 将内存空间划分为两个相等的区域(例如,From 空间和 To 空间)。
- 每次只使用其中一个区域(例如,From 空间)。
- 当 From 空间满时,进行垃圾回收。
- 将 From 空间中存活的对象复制到 To 空间。
- 清除 From 空间中的所有对象。
- 交换 From 空间和 To 空间的角色。
- 优点:
- 实现简单,运行高效: 只需要遍历存活对象,并将它们复制到另一个区域。
- 不会产生内存碎片: 复制后对象是连续排列的。
- 缺点:
- 浪费空间: 需要预留一半的内存空间用于复制。
- 对象移动: 复制对象需要修改对象的引用,增加了开销(特别是对于大对象)。
- 适用场景:
- 适用于存活对象较少、垃圾对象较多的场景(例如,新生代)。
3. 标记-整理算法 (Mark-Compact):
- 原理:
- 标记 (Mark): 从 GC Roots 开始,递归地标记所有可达对象。
- 整理 (Compact): 将所有存活对象移动到内存空间的一端,然后清理掉边界以外的内存。
- 优点:
- 不会产生内存碎片: 整理后对象是连续排列的。
- 充分利用内存: 不需要像复制算法那样预留空间。
- 缺点:
- 效率较低: 需要移动对象,开销较大。
- 需要“Stop The World”: 在标记和整理阶段,需要暂停所有用户线程。
- 适用场景:
- 适用于存活对象较多、垃圾对象较少的场景(例如,老年代)。
4. 分代收集算法 (Generational Collection):
- 原理:
- 将 Java 堆划分为不同的代(Generation),根据对象的生命周期采用不同的垃圾收集算法。
- 新生代 (Young Generation): 存放新创建的对象。
- 大多数对象在新生代被回收。
- 使用复制算法进行垃圾回收 (Minor GC)。
- 划分为 Eden 区和 Survivor 区 (From Survivor 和 To Survivor)。
- 老年代 (Old Generation): 存放生命周期较长的对象,或大对象。
- 使用标记-清除算法或标记-整理算法进行垃圾回收 (Major GC 或 Full GC)。
- 优点:
- 针对性强: 根据对象的生命周期特点采用不同的垃圾收集算法,提高了垃圾回收效率。
- 减少停顿时间: 新生代使用复制算法,Minor GC 的停顿时间通常较短。
- 缺点:
- 实现复杂: 需要管理多个代,增加了算法的复杂性。
- 适用场景:
- 适用于大多数 Java 应用程序。
HotSpot VM 中的垃圾收集器:
垃圾收集器 | 算法 | 特点 | 适用场景 |
---|---|---|---|
Serial | 复制 (新生代) + 标记-整理 (老年代) | 单线程,Stop-The-World | 客户端模式,小型应用 |
ParNew | 复制 (新生代) | Serial 的多线程版本,Stop-The-World | 多核 CPU,与 CMS 配合使用 |
Parallel Scavenge | 复制 (新生代) + 标记-整理 (老年代) | 多线程,Stop-The-World,吞吐量优先 | 吞吐量优先的应用(例如,后台计算) |
Serial Old | 标记-整理 | Serial 的老年代版本,单线程,Stop-The-World | 客户端模式,小型应用,或与 Parallel Scavenge 配合使用 |
Parallel Old | 标记-整理 | Parallel Scavenge 的老年代版本,多线程,Stop-The-World | 吞吐量优先的应用 |
CMS (Concurrent Mark Sweep) | 并发标记-清除 (老年代) + 复制 (新生代) | 并发收集,低停顿,但会产生内存碎片,可能会发生 Concurrent Mode Failure | 响应时间优先的应用(例如,Web 应用) |
G1 (Garbage-First) | 复制 + 标记-整理 (混合) | 将堆划分为多个区域 (Region),并发收集,低停顿,可预测的停顿时间,适用于大堆内存 | 大堆内存,低延迟的应用 |
ZGC | 标记-复制 (着色指针, 读屏障) | 并发收集,极低停顿 (通常小于 10ms),适用于大堆内存 | JDK 11+,需要极低延迟的应用 |
Shenandoah | 标记-复制 | 并发收集,低停顿,与应用线程并发执行 | 低延迟的应用 |
如何选择垃圾收集器:
- 吞吐量优先: Parallel Scavenge + Parallel Old
- 响应时间优先: CMS (老版本 JDK) 或 G1 (JDK 8+ 推荐) 或 ZGC/Shenandoah (JDK 11+)
- 小内存应用或客户端模式: Serial
- 大内存且需要低延迟: G1, ZGC, Shenandoah
总结:
不同的垃圾收集算法有不同的优缺点,适用于不同的场景。 HotSpot VM 提供了多种垃圾收集器,可以根据应用程序的特点和性能目标进行选择和配置。