G1垃圾回收器将堆内存划分为多个大小相等的Region,每个Region可以是Eden、Survivor、Old等类型,不同Region之间可能存在对象引用关系。RSet(Remembered Set)就是用来记录这些跨Region引用的数据结构,在GC时只需要扫描RSet就能找到所有引用当前Region对象的外部引用,不需要遍历整个堆。但如果RSet的配置不合理,或者应用中跨Region引用过于频繁,就会导致RSet的维护成本和扫描开销大幅上升,反而影响GC性能。

RSet的基本工作原理
RSet本质上是一个哈希表,记录了“哪些Region的哪些Card引用了当前Region的对象”。G1将每个Region划分为多个512字节的Card,当发生跨Region引用时,会在引用方Region的RSet中添加一条记录,标记被引用对象所在的Card。在Young GC或者Mixed GC时,G1会扫描Old区Region的RSet,找到所有引用Eden/Survivor区对象的引用,避免全堆扫描。
正常情况下RSet的开销很小,但如果出现以下情况,就会导致RSet的扫描和维护开销升高:
- 应用中存在大量生命周期长的对象,频繁被不同Region的短生命周期对象引用
- 堆内存中Region数量过多,导致RSet的条目数量膨胀
- RSet的精细度配置不合理,存储了过多不必要的引用信息
跨Region引用扫描开销的排查方法
首先需要通过GC日志确认是否存在RSet相关的开销过高问题,开启以下JVM参数可以输出详细的GC信息:
-XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintTenuringDistribution -XX:+PrintAdaptiveSizePolicy
在GC日志中,如果出现以下特征,说明RSet相关开销可能存在问题:
- GC停顿时间中,
Update RS或者Scan RS阶段的耗时占比超过20% - GC日志中出现大量
RSet processing相关的耗时记录 - 老年代Region的RSet占用内存过高,通过
jstat -gc可以看到OGCMX和OGC的数值异常波动
RSet调优实战方案
1. 调整RSet的精细度配置
G1提供了三个参数控制RSet的精细度,默认配置已经适配大部分场景,但如果跨Region引用特别多,可以适当调整:
| 参数 | 默认值 | 作用 |
|---|---|---|
| -XX:G1RSetUpdatingPauseTimePercent | 10 | 控制GC停顿中用于更新RSet的时间占比,降低该值可以减少单次GC停顿时间,但会增加RSet的更新延迟 |
| -XX:G1RSetRegionEntries | 0 | 每个Region的RSet最多存储的引用Region数量,0表示自适应,过小会导致RSet频繁扩容,过大则浪费内存 |
| -XX:G1RSetSparseRegionEntries | 0 | RSet稀疏表的初始条目数,0表示自适应,大量稀疏引用时可以调大该值减少扩容开销 |
如果GC日志中Update RS阶段耗时过高,可以尝试降低G1RSetUpdatingPauseTimePercent的值,比如调整为5,将RSet的更新工作分摊到更多的GC周期中:
-XX:G1RSetUpdatingPauseTimePercent=5
2. 优化应用的对象引用模式
很多RSet开销过高的问题本质是应用的对象引用设计不合理,比如缓存了大量长生命周期对象,同时被大量短生命周期的业务对象引用,导致Old区Region的RSet不断膨胀。这种场景下调整JVM参数效果有限,需要从代码层面优化:
- 避免将长生命周期对象作为短生命周期对象的成员变量,减少跨Region引用
- 缓存对象尽量使用弱引用或者软引用,避免长期占用老年代Region
- 大对象尽量放在Humongous Region中,G1对Humongous对象的RSet处理有单独的优化逻辑
3. 调整Region大小和堆内存配置
Region的大小会影响RSet的条目数量,Region越小,堆中Region的数量越多,跨Region引用的概率就越高,RSet的开销也会越大。可以通过-XX:G1HeapRegionSize调整Region大小,可选值为1MB到32MB,必须是2的幂次:
# 设置Region大小为4MB,减少Region数量,降低跨Region引用概率 -XX:G1HeapRegionSize=4m
同时需要合理设置堆内存的最大值和最小值,避免堆内存频繁扩容缩容导致Region数量波动,进而引发RSet的频繁调整:
-Xms4g -Xmx4g
调优效果验证
调整参数后需要重新运行应用,采集至少3个GC周期的数据进行对比,重点观察以下指标:
- GC停顿时间中
Update RS和Scan RS的耗时占比是否下降 - 单次GC的平均停顿时间是否有明显降低
- 应用的吞吐量(单位时间内处理的请求数)是否有提升
如果调整后指标没有改善,需要重新排查是否存在其他GC瓶颈,比如晋升失败、并发标记周期过长等问题,不要盲目继续调整RSet相关参数。
常见误区提醒
不要为了降低RSet开销刻意减小堆内存或者增大Region大小,这会导致GC频率升高,反而影响整体性能。所有调优都需要基于实际的GC日志和应用负载进行,没有通用的万能参数。
另外不要禁用RSet,G1的设计依赖RSet实现高效的跨Region引用扫描,禁用RSet会导致GC时全堆扫描,性能损耗会远高于RSet本身的开销。