Java虛擬機工作原理詳解

一、類加載器

首先來看一下java程序的執行過程。

Java虛擬機工作原理詳解

從這個框圖很容易大體上了解java程序工作原理。首先,你寫好java代碼,保存到硬盤當中。然後你在命令行中輸入

<code>javac YourClassName.java  /<code>

此時,你的java代碼就被編譯成字節碼(.class).如果你是在Eclipse IDE或者其他開發工具中,你保存代碼的時候,開發工具已經幫你完成了上述的編譯工作,因此你可以在對應的目錄下看到class文件。此時的class文件依然是保存在硬盤中,因此,當你在命令行中運行

<code>java YourClassName  /<code>

就完成了上面紅色方框中的工作。JRE的來加載器從硬盤中讀取class文件,載入到系統分配給JVM的內存區域--運行數據區(Runtime Data Areas). 然後執行引擎解釋或者編譯類文件,轉化成特定CPU的機器碼,CPU執行機器碼,至此完成整個過程。

接下來就重點研究一下類加載器究竟為何物?又是如何工作的?

首先看一下來加載器的一些特點,有點抽象,不過總有幫助的。

1. 層級結構

類加載器被組織成一種層級結構關係,也就是父子關係。其中,Bootstrap是所有類加載器的父親。如下圖所示:

  • Bootstrap class loader:當運行java虛擬機時,這個類加載器被創建,它加載一些基本的java API,包括Object這個類。需要注意的是,這個類加載器不是用java語言寫的,而是用C/C++寫的。
  • Extension class loader:這個加載器加載出了基本API之外的一些拓展類,包括一些與安全性能相關的類。(目前瞭解得不是很深,只能籠統說,待日後再詳細說明)
  • System Class Loader:它加載應用程序中的類,也就是在你的classpath中配置的類。
  • User-Defined Class Loader:這是開發人員通過拓展ClassLoader類定義的自定義加載器,加載程序員定義的一些類。

2. 委派模式(Delegation Mode)

仔細看上面的層次結構,當JVM加載一個類的時候,下層的加載器會將將任務委託給上一層類加載器,上一層加載檢查它的命名空間中是否已經加載這個類,如果已經加載,直接使用這個類。如果沒有加載,繼續往上委託直到頂部。檢查完了之後,按照相反的順序進行加載,如果Bootstrap加載器找不到這個類,則往下委託,直到找到類文件。對於某個特定的類加載器來說,一個Java類只能被載入一次,也就是說在Java虛擬機中,類的完整標識是(classLoader,package,className)。一個雷可以被不同的類加載器加載。

Java虛擬機工作原理詳解

舉個具體的例子來說明,現在加入我有一個自己定義的類MyClass需要加載,如果不指定的話,一般交App(System)加載。接到任務後,System檢查自己的庫裡是否已經有這個類,發現沒有之後委託給Extension,Extension進行同樣的檢查,發現還是沒有繼續往上委託,最頂層的Boots發現自己庫裡也沒有,於是根據它的路徑(Java 核心類庫,如java.lang)嘗試去加載,沒找到這個MaClass類,於是只好(人家看好你,交給你完成,你無能為力,只好交給別人啦)往下委託給Extension,Extension到自己的路徑(JAVA_HOME/jre/lib/ext)是找,還是沒找到,繼續往下,此時System加載器到classpath路徑尋找,找到了,於是加載到Java虛擬機。

現在假設我們將這個類放到JAVA_HOME/jre/lib/ext這個路徑中去(相當於交給Extension加載器加載),按照同樣的規則,最後由Extension加載器加載MyClass類,看到了吧,統一各類被兩次加載到JVM,但是每次都是由不同的ClassLoader完成。

3. 可見性限制

下層的加載器能夠看到上層加載器中的類,反之則不行,也就是是說委託只能從下到上。

4. 不允許卸載類

類加載器可以加載一個類,但是它不能卸載一個類。但是類加載器可以被刪除或者被創建。

當類加載完畢之後,JVM繼續按照下圖完成其他工作:

Java虛擬機工作原理詳解

框圖中各個步驟簡單介紹如下:

  • Loading:文章前面介紹的類加載,將文件系統中的Class文件載入到JVM內存(運行數據區域)
  • Verifying:檢查載入的類文件是否符合Java規範和虛擬機規範。
  • Preparing:為這個類分配所需要的內存,確定這個類的屬性、方法等所需的數據結構。(Prepare a data structure that assigns the memory required by classes and indicates the fields, methods, and interfaces defined in the class.)
  • Resolving:將該類常量池中的符號引用都改變為直接引用。(不是很理解)
  • Initialing:初始化類的局部變量,為靜態域賦值,同時執行靜態初始化塊。

那麼,Class Loader在加載類的時候,究竟做了些什麼工作呢?

要了解這其中的細節,必須得先詳細介紹一下運行數據區域。

二、運行數據區域

Runtime Data Areas:當運行一個JVM示例時,系統將分配給它一塊內存區域(這塊內存區域的大小可以設置的),這一內存區域由JVM自己來管理。從這一塊內存中分出一塊用來存儲一些運行數據,例如創建的對象,傳遞給方法的參數,局部變量,返回值等等。分出來的這一塊就稱為運行數據區域。運行數據區域可以劃分為6大塊:Java棧、程序計數寄存器(PC寄存器)、本地方法棧(Native Method Stack)、Java堆、方法區域、運行常量池(Runtime Constant Pool)。運行常量池本應該屬於方法區,但是由於其重要性,JVM規範將其獨立出來說明。其中,前面3各區域(PC寄存器、Java棧、本地方法棧)是每個線程獨自擁有的,後三者則是整個JVM實例中的所有線程共有的。這六大塊如下圖所示:

Java虛擬機工作原理詳解

①. PC計數器:每一個線程都擁有一個PC計數器,當線程啟動(start)時,PC計數器被創建,這個計數器存放當前正在被執行的字節碼指令(JVM指令)的地址。

②. Java棧:同樣的,Java棧也是每個線程單獨擁有,線程啟動時創建。這個棧中存放著一系列的棧幀(Stack Frame),JVM只能進行壓入(Push)和彈出(Pop)棧幀這兩種操作。每當調用一個方法時,JVM就往棧裡壓入一個棧幀,方法結束返回時彈出棧幀。如果方法執行時出現異常,可以調用printStackTrace等方法來查看棧的情況。棧的示意圖如下:

Java虛擬機工作原理詳解

OK。現在我們再來詳細看看每一個棧幀中都放著什麼東西。從示意圖很容易看出,每個棧幀包含三個部分:本地變量數組,操作數棧,方法所屬類的常量池引用。

1. 局部(本地)變量數組

局部(本地)變量數組中,從0開始按順序存放方法所屬對象的引用、傳遞給方法的參數、局部變量。舉個例子:

<code>public void doSomething(int a, double b, Object o) {
...
}/<code>

這個方法的棧幀中的局部變量存儲的內容分別是:

<code>0: this  
1: a
2,3:b
4:0/<code>

看仔細了,其中double類型的b需要兩個連續的索引。取值的時候,取出的是2這個索引中的值。如果是靜態方法,則數組第0個不存放this引用,而是直接存儲傳遞的參數。

2. 操作數棧

操作數棧中存放方法執行時的一些中間變量,JVM在執行方法時壓入或者彈出這些變量。其實,操作數棧是方法真正工作的地方,執行方法時,局部變量數組與操作數棧根據方法定義進行數據交換。例如,執行以下代碼時,操作數棧的情況如下:

<code>int a = 90;
int b = 10;
int c = a + b;/<code>
Java虛擬機工作原理詳解

注意在這個圖中,操作數棧的地步是在上邊,所以先壓入的100位於上方。可以看出,操作數棧其實是一個數據臨時存儲區,存放一些中間變量,方法結束了,操作數棧也就沒有啦。

3. 棧幀中數據引用

除了局部變量數組和操作數棧之外,棧幀還需要一個常量池的引用。當JVM執行到需要常量池的數據時,就是通過這個引用來訪問常量池的。棧幀中的數據還要負責處理方法的返回和異常。如果通過return返回,則將該方法的棧幀從Java棧中彈出。如果方法有返回值,則將返回值壓入到調用該方法的方法的操作數棧中。另外,數據區中還保存中該方法可能的異常表的引用。下面的例子用來說明:

<code>class Example3C{
public static void addAndPrint(){
double result = addTwoTypes(1,88.88);
System.out.println(result);
}
public static double addTwoTypes(int i, double d){
return i+d;
}
}/<code>

執行上述代碼時,Java棧如下圖所示:

Java虛擬機工作原理詳解

花些時間好好研究上圖。一樣需要注意的是,棧的底部在上方,先押人員addAndPrint方法的棧幀,再壓入addTwoTypes方法的棧幀。上圖最右邊的文字說明有錯誤,應該是addTwoTypes的執行結果存放在addAndPrint的操作數棧中。

4. 本地方法棧

當程序通過JNI(Java Native Interface)調用本地方法(如C或者C++代碼)時,就根據本地方法的語言類型建立相應的棧。

5. 方法區域

方法區域是一個JVM實例中的所有線程共享的,當啟動一個JVM實例時,方法區域被創建。它用於存運行放常量池、有關域和方法的信息、靜態變量、類和方法的字節碼。不同的JVM實現方式在實現方法區域的時候會有所區別。Oracle的HotSpot稱之為永久區域(Permanent Area)或者永久代(Permanent Generation)。

6. 運行常量池

這個區域存放類和接口的常量,除此之外,它還存放方法和域的所有引用。當一個方法或者域被引用的時候,JVM就通過運行常量池中的這些引用來查找方法和域在內存中的的實際地址。

7. 堆(Heap)

堆中存放的是程序創建的對象或者實例。這個區域對JVM的性能影響很大。垃圾回收機制處理的正是這一塊內存區域。

所以,類加載器加載其實就是根據編譯後的Class文件,將java字節碼載入JVM內存,並完成對運行數據處於的初始化工作,供執行引擎執行。

三、 執行引擎(Execution Engine)

類加載器將字節碼載入內存之後,執行引擎以Java 字節碼指令為但願,讀取Java字節碼。問題是,現在的java字節碼機器是讀不懂的,因此還必須想辦法將字節碼轉化成平臺相關的機器碼。這個過程可以由解釋器來執行,也可以有即時編譯器(JIT Compiler)來完成。

Java程序員福利:金三銀四,我把最近一年經歷過的Java崗位面試,和一些刷過的面試題都做成了PDF,PDF都是可以免費分享給大家的,關注私信我:【101】,免費領取!


分享到:


相關文章: