JVM垃圾回收算法

前言

在JVM內存模型中會將堆內存劃分新生代、老年代兩個區域,兩塊區域的主要區別在於新生代存放存活時間較短的對象,老年代存放存活時間較久的對象,除了存活時間不同外,還有垃圾回收策略的不同,在JVM中中有以下回收算法:

  • 標記清除
  • 標記整理
  • 複製算法
  • 分代收集算法

有了垃圾回收算法,那JVM是如果確定對象是垃圾對象的呢?判斷對象是否存活JVM也會有幾套自己判斷算法了:

  • 引用記數
  • 可達性分析

有了垃圾回收和判斷對象存在這兩個概念後,再來逐步分析它們。

JVM是如何判斷對象是否存活的?

要是讓開發人員來判斷一個對象是否有用是很簡單的,簡單的說就是:對象沒有任何引用就認為該對象可以被回收了。假設有如下程序代碼:

public class App {
 public static void main(){
 checkFile("/");
 }
 public static boolean checkFile(String path ){
 File file = new File(path);
 return file.exists();
 }
}

程序執行起來在調用checkFile的時候JVM圖大概像這樣:

JVM垃圾回收算法

到checkFile方法執行完成之後,它裡面的局部變量file就會隨著棧幀一起被清理,這個時候還存活在JVM堆中的File對象也是無用的了:

JVM垃圾回收算法

要是人為來判斷非常清晰的就發現File對象已經無用了,那換成JVM它又是如何來判斷對象是否能存活的呢?

引用記數

引用記數算法原理比較簡單,想象下有個對象它有一個count屬性,每次引用該對象都會使count加1,假設JVM在判斷該對象是否存活的時候去檢查這個count屬性,發現這個屬性不為0說明還有其他對象在引用該對象。

JVM垃圾回收算法

等到checkFile方法執行完之後count就會減1變成0:

JVM垃圾回收算法

這樣一來JVM就很容易判斷一個對象是否存活了。

但是引用記數有一個明顯的缺點,就是無法解決循環引用的問題比如:A --> B --> A 這樣的對象關係它是沒有辦法來判斷對象是否該不該回收的。

GC Root(可達性分析)

為什麼會被稱為可達性分析算法呢?可以這樣理解如果通過GC Root能到達一個對象那麼這個對象就是存活的。那什麼樣的對象才是GC Root呢?

在Java語言中,可作為GC Roots的對象包括下面幾種:

  1. 虛擬機棧中引用的對象(棧幀中的本地變量表);
  2. 方法區中類靜態屬性引用的對象;
  3. 方法區中常量引用的對象;
  4. 本地方法棧中JNI(Native方法)引用的對象。

還是用上面的例子,在checkFile方法執行時,因為棧幀變量file可做為GC Root所以在執行期間JVM是絕對不會回收掉這個File對象:

JVM垃圾回收算法

但是等到checkFile執行完成之後,這個棧幀會被彈出,其中的變量也會被釋放,相應的沒有GC Root能到達堆中的File對象,這個時候就可以判斷這個對象是一個無用的對象了,然後安全回收。

垃圾收回算法

標記清除

這種算法分兩分:標記、清除兩個階段,

標記階段是從根集合(GC Root)開始掃描,每到達一個對象就會標記該對象為存活狀態,清除階段在掃描完成之後將沒有標記的對象給清除掉。

用一張圖說明:

JVM垃圾回收算法

這個算法有個缺陷就是會產生內存碎片,如上圖B被清除掉後會留下一塊內存區域,如果後面需要分配大的對象就會導致沒有連續的內存可供使用。

標記整理

標記整理就沒有內存碎片的問題了,也是從根集合(GC Root)開始掃描進行標記然後清除無用的對象,清除完成後它會整理內存。

JVM垃圾回收算法

這樣內存就是連續的了,但是產生的另外一個問題是:每次都得移動對象,因此成本很高。

複製算法

複製算法會將JVM推分成二等分,如果堆設置的是1g,那使用複製算法的時候堆就會有被劃分為兩塊區域各512m。給對象分配內存的時候總是使用其中的一塊來分配,分配滿了以後,GC就會進行標記,然後將存活的對象移動到另外一塊空白的區域,然後清除掉所有沒有存活的對象,這樣重複的處理,始終就會有一塊空白的區域沒有被合理的利用到。

JVM垃圾回收算法

兩塊區域交替使用,最大問題就是會導致空間的浪費,現在堆內存的使用率只有50%。

分代回收

新生代回收

JVM的堆分為新生代和老年代,兩種類型有不同的特性,根據它們的特性來選擇不同的回收算法,這種算法會將新生代劃分為一塊Eden和二個Survivor區:

JVM垃圾回收算法

如上面的圖有三塊區域它們會按照8:1:1的比例進行分配,如1000m的堆Eden是800m,二個Survivor各佔100m,那它們是如何運行的呢?

  1. 始終會有一塊Survivor是空著的,內存使用率是90%
  2. 程序運行會在Eden和其中一塊Survivor 1中分配內存
  3. 等到執行Minor gc,會將存活下來的對象移動到空著的Survivor 2中
  4. 然後在Eden和Survivor 2中繼續分配內存,Survivor 1空著等著下次使用

這樣就能使內存使用率達到90%,也不會產生內存碎片。

老年代回收

老年代對象即使進行了垃圾回收,對象的存活率也高,所以採用標記清除或標記整理算法都是不錯的選擇,這裡就不做闡述。


分享到:


相關文章: