垃圾回收算法

2019-08-09

为什么要垃圾回收

Java语言中一个显著的特点就是引入了垃圾回收机制，使c++程序员最头疼的内存管理的问题迎刃而解。由于有个垃圾回收机制，Java中的对象不再有“作用域”的概念，只有对象的引用才有“作用域”。垃圾回收可以有效的防止内存泄露，有效的使用空闲的内存。

对象存活算法之引用计数法

引用计数法

堆中每个对象实例都有一个引用计数。当一个对象被创建时，且将该对象实例分配给一个变量，该变量计数设置为1。当任何其它变量被赋值为这个对象的引用时，计数加1（a = b,则b引用的对象实例的计数器+1），但当一个对象实例的某个引用超过了生命周期或者被设置为一个新值时，对象实例的引用计数器减1。任何引用计数器为0的对象实例可以被当作垃圾收集。当一个对象实例被垃圾收集时，它引用的任何对象实例的引用计数器减1。（局部变量表的生命周期跟随方法的运行和结束）

优点
引用计数收集器可以很快的执行，交织在程序运行中。对程序需要不被长时间打断的实时环境比较有利。

缺点
无法检测出循环引用。如父对象有一个对子对象的引用，子对象反过来引用父对象。这样，他们的引用计数永远不可能为0.

在代码中分析JVM是否采用引用计数法的垃圾回收机制

run configurations—vm options—加配置项
	-verbose:gc  -XX:+PrintGCDetails

public class ReferenceCountingGC {

    public Object instance = null;
    private static final int num = 1024*1024;
    private byte[] bigSize = new byte[2*num];

    public static void main(String[] args) {
        ReferenceCountingGC objA= new ReferenceCountingGC();
        ReferenceCountingGC objB= new ReferenceCountingGC();
        objA.instance = objB;
        objB.instance = objA;
        objA = null;
        objB = null;
        //查看是否被回收，如果没有被回收，代表JVM使用的是引用计数器回收算法，因为引用计数器算法无法回收循环引用的对象
        //发现GC回收生效
        //JVM1.8已经不再使用引用计数器
        System.gc();
    }
}

对象存活算法之可达性分析

可达性分析法

可达性分析算法的概念(又叫跟搜索法)，根搜索算法是从离散数学中的图论引入的，程序把所有的引用关系看作一张图，从一个节点GC ROOT开始，寻找对应的引用节点，找到这个节点以后，继续寻找这个节点的引用节点，当所有的引用节点寻找完毕之后，剩余的节点则被认为是没有被引用到的节点，即无用的节点。
可达性分析算法可以解决循环引用的问题。

java中可作为GC Root的对象有

虚拟机栈中引用的对象（局部变量表）
本地方法栈中引用的对象
方法区中静态属性引用的对象（static String bb = "321";）
方法区中常量引用的对象（static final String aa = "123";）

垃圾收集算法之标记清除法

标记清除法

最基础的收集算法是“标记-清除”（Mark-Sweep）算法，如同它的名字一样，算法分为“标记”和“清除”两个阶段：

首先标记出所有需要回收的对象（标记过程使用了引用计数法或可达性分析法）。
在标记完成后统一回收所有被标记的对象。

缺点

一个是效率问题，标记和清除两个过程的效率都不高；
另一个是空间问题，标记清除之后会产生大量不连续的内存碎片，空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时，无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

垃圾收集算法之复制算法

复制算法

为什么出现复制算法？

为了解决效率问题，一种称为“复制”（Copying）的收集算法出现了，它将可用内存按量划分为大小相等的两块，每次只使用其中的一块。
当这一块的内存用完了，就将还存活着的对象复制到另外一块上面，然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收，内存分配时也就不用考虑内存碎片等复杂情况，只要移动堆顶指针，按顺序分配内存即可，实现简单，运行高效。

现在的商业虚拟机都采用这种收集算法来回收"新生代"对象，研究表明，新生代中的对象 98%是“朝生夕死”的，所以并不需要按照 1:1 的比例来划分内存空间，而是将内存分为一块较大的 Eden 空间和两块较小的 Survivor 空间，每次使用 Eden 和其中一块 Survivor。 Survivor from 和Survivor to(用来保存Eden和Survior from区中存活的对象) ，内存比例 8：1：1
当回收时，将 Eden 和 Survivor from中还存活着的对象一次性地复制到另外一块 Survivor to空间上，最后清理掉 Eden 和刚才用过的 Survivor from空间。HotSpot 虚拟机默认 Eden 和 Survivor from 的大小比例是 8:1, 也就是每次新生代中可用内存空间为整个新生代容量的 90% (80%+10%），只有 10% 的内存会被“浪费”。当然，98%的对象可回收只是一般场景下的数据，我们没有办法保证每次回收都只有不多于 10%的对象存活，当 Survivor to 空间不够用时，需要依赖其他内存（这里指老年代）进行分配担保（Handle Promotion）。

垃圾收集算法之标记整理与分代收集算法

复制收集算法不适用于老年代
复制算法在对象存活率较高时就要进行较多的复制操作，效率将会变低。更关键的是，如果不想浪费 50%的空间（复制算法需要开辟两块一样大小的内存），就需要有额外的空间进行分配担保，以应对被使用的内存中所有对象都 100%存活的极端情况，所以在老年代一般不能直接选用这种算法。

标记整理算法

根据老年代的特点，有人提出了另外一种“标记-整理（Mark- Compact）算法，标记过程仍然与“标记-清除”算法一样，但后续步骤不是直接对可回收对象进行清理，而是让所有存活的对象都向一端移动，然后直接清理掉端边界以外的内存

垃圾收集算法之分代收集算法

一般把 Java 堆分为新生代和老年代，这样就可以根据各个年代的特点采用最适当的收集算法。

在新生代中，每次垃圾收集时都发现有大批对象死去，只有少量存活，那就选用“复制算法”，只需要付出少量存活对象的复制成本就可以完成收集。
而老年代中因为对象存活率高、没有额外空间对它进行分配担保，就必须使用“标记清理”或者“标记整理(没有内存碎片，更加优秀)”算法来进行回收。

作者：Soulboy