前端基礎:深入V8引擎的內部及編寫優化代碼的5個技巧

JavaScript引擎是執行 JavaScript 代碼的程序或解釋器。JavaScript引擎可以理解為標準解釋器,或者以某種形式將JavaScript編譯為字節碼的即時編譯器。

以下為實現JavaScript引擎的流行項目列表:

  • V8 — 開源,由 Google 開發,用 C ++ 編寫
  • Rhino — 由 Mozilla 基金會管理,開源,完全用 Java 開發
  • SpiderMonkey — 是第一個支持 Netscape Navigator 的 JavaScript 引擎,目前正供 Firefox 使用
  • JavaScriptCore — 開源,以Nitro形式銷售,由蘋果為Safari開發
  • KJS — KDE 的引擎,最初由 Harri Porten 為 KDE 項目中的 Konqueror 網頁瀏覽器開發
  • Chakra (JScript9) — Internet Explorer
  • Chakra (JavaScript) — Microsoft Edge
  • Nashorn, 作為 OpenJDK 的一部分,由 Oracle Java 語言和工具組編寫
  • JerryScript — 物聯網的輕量級引擎

為什麼要創建V8引擎?

由谷歌構建的V8引擎是開源的,使用c++編寫。這個引擎是在谷歌Chrome中使用的,但是,與其他引擎不同的是 V8 也用於流行的 node.js

V8最初被設計用來提高web瀏覽器中JavaScript執行的性能。為了獲得速度,V8 將 JavaScript 代碼轉換成更高效的機器碼,而不是使用解釋器。它通過實現 JIT (Just-In-Time) 編譯器將 JavaScript 代碼編譯為執行時的機器碼,就像許多現代 JavaScript 引擎(如SpiderMonkey或Rhino (Mozilla)) 所做的那樣。這裡的主要區別是 V8 不生成字節碼或任何中間代碼

V8 曾有兩個編譯器

在 V8 的 5.9 版本出來之前,V8 引擎使用了兩個編譯器:

  • full-codegen — 一個簡單和非常快的編譯器,產生簡單和相對較慢的機器碼。
  • Crankshaft — 一種更復雜(Just-In-Time)的優化編譯器,生成高度優化的代碼。

V8 引擎也在內部使用多個線程

  • 主線程執行你所期望的操作:獲取代碼、編譯代碼並執行它
  • 還有一個單獨的線程用於編譯,因此主線程可以在前者優化代碼的同時繼續執行
  • 一個 Profiler 線程,它會告訴運行時我們花了很多時間,讓 Crankshaft 可以優化它們
  • 一些線程處理垃圾收集器

當第一次執行 JavaScript 代碼時,V8 利用 full-codegen 編譯器,直接將解析的 JavaScript 翻譯成機器代碼而不進行任何轉換。這使得它可以非常快速地開始執行機器代碼。請注意,V8 不使用中間字節碼,從而不需要解釋器。

當代碼已經運行一段時間後,分析線程已經收集了足夠的數據來判斷應該優化哪個方法。

接下來,Crankshaft 從另一個線程開始優化。它將 JavaScript 抽象語法樹轉換為被稱為 Hydrogen 的高級靜態單分配(SSA)表示,並嘗試優化 Hydrogen 圖,大多數優化都是在這個級別完成的。

內聯代碼

第一個優化是提前內聯儘可能多的代碼。內聯是用被調用函數的主體替換調用點(調用函數的代碼行)的過程。這個簡單的步驟允許下面的優化更有意義。

前端基礎:深入V8引擎的內部及編寫優化代碼的5個技巧

隱藏類

JavaScript是一種基於原型的語言:沒有使用克隆過程創建類和對象。JavaScript也是一種動態編程語言,這意味著可以在實例化後輕鬆地在對象中添加或刪除屬性。

大多數 JavaScript 解釋器使用類似字典的結構(基於哈希函數)來存儲對象屬性值在內存中的位置,這種結構使得在 JavaScript 中檢索屬性的值比在 Java 或 C# 等非動態編程語言中的計算成本更高。

在Java中,所有對象屬性都是在編譯之前由固定對象佈局確定的,並且無法在運行時動態添加或刪除。

因此,屬性值(或指向這些屬性的指針)可以作為連續緩衝區存儲在存儲器中,每個緩衝區之間具有固定偏移量, 可以根據屬性類型輕鬆確定偏移的長度,而在運行時可以更改屬性類型的 JavaScript 中這是不可能的。

由於使用字典查找內存中對象屬性的位置效率非常低,因此 V8 使用了不同的方法:隱藏類。隱藏類與 Java 等語言中使用的固定對象(類)的工作方式類似,只是它們是在運行時創建的。現在,讓我們看看他們實際的例子:

前端基礎:深入V8引擎的內部及編寫優化代碼的5個技巧

一旦 “new Point(1,2)” 調用發生,V8 將創建一個名為 “C0” 的隱藏類。

前端基礎:深入V8引擎的內部及編寫優化代碼的5個技巧

尚未為 Point 定義屬性,因此“C0”為空。

一旦第一個語句“this.x = x”被執行(在“Point”函數內),V8 將創建一個名為 “C1” 的第二個隱藏類,它基於“C0”。 “C1”描述了可以找到屬性 x 的存儲器中的位置(相對於對象指針)。

在這種情況下,“x”存儲在偏移0處,這意味著當將存儲器中的 point 對象視為連續緩衝區時,第一偏移將對應於屬性 “x”。 V8 還將使用 “類轉換” 更新 “C0” ,該類轉換指出如果將屬性 “x” 添加到 point 對象,則隱藏類應從 “C0” 切換到 “C1”。 下面的 point 對象的隱藏類現在是“C1”。

前端基礎:深入V8引擎的內部及編寫優化代碼的5個技巧

每次將新屬性添加到對象時,舊的隱藏類都會更新為指向新隱藏類的轉換路徑。隱藏類轉換非常重要,因為它們允許在以相同方式創建的對象之間共享隱藏類。如果兩個對象共享一個隱藏類並且同一屬性被添加到它們中,則轉換將確保兩個對象都接收相同的新隱藏類以及隨其附帶的所有優化代碼。

當語句 “this.y = y” 被執行時,會重複同樣的過程(在 “Point” 函數內部,“this.x = x”語句之後)。

一個名為“C2”的新隱藏類會被創建,如果將一個屬性 “y” 添加到一個 Point 對象(已經包含屬性“x”),一個類轉換會添加到“C1”,則隱藏類應該更改為“C2”,point 對象的隱藏類更新為“C2”。

前端基礎:深入V8引擎的內部及編寫優化代碼的5個技巧

隱藏類轉換取決於將屬性添加到對象的順序。看看下面的代碼片段:

前端基礎:深入V8引擎的內部及編寫優化代碼的5個技巧

現在,假設對於p1和p2,將使用相同的隱藏類和轉換。那麼,對於“p1”,首先添加屬性“a”,然後添加屬性“b”。然而,“p2”首先分配“b”,然後是“a”。因此,由於不同的轉換路徑,“p1”和“p2”以不同的隱藏類別結束。在這種情況下,以相同的順序初始化動態屬性好得多,以便隱藏的類可以被重用。

內聯緩存

V8利用了另一種優化動態類型語言的技術,稱為內聯緩存。內聯緩存依賴於這樣一種觀察,即對同一方法的重複調用往往發生在同一類型的對象上。這裡可以找到對內聯緩存的深入解釋。接下來將討論內聯緩存的一般概念。那麼它是如何工作的呢? V8 維護了在最近的方法調用中作為參數傳遞的對象類型的緩存,並使用這些信息預測將來作為參數傳遞的對象類型。如果 V8 能夠很好地預測傳遞給方法的對象的類型,它就可以繞過如何訪問對象屬性的過程,而是使用從以前的查找到對象的隱藏類的存儲信息。

那麼隱藏類和內聯緩存的概念如何相關呢?無論何時在特定對象上調用方法時,V8 引擎都必須執行對該對象的隱藏類的查找,以確定訪問特定屬性的偏移量。在同一個隱藏類的兩次成功的調用之後,V8 省略了隱藏類的查找,並簡單地將該屬性的偏移量添加到對象指針本身。對於該方法的所有下一次調用,V8 引擎都假定隱藏的類沒有更改,並使用從以前的查找存儲的偏移量直接跳轉到特定屬性的內存地址。這大大提高了執行速度。

內聯緩存也是為什麼相同類型的對象共享隱藏類非常重要的原因。 如果你創建兩個相同類型和不同隱藏類的對象(正如我們之前的例子中所做的那樣),V8將無法使用內聯緩存,因為即使這兩個對象屬於同一類型,它們對應的隱藏類為其屬性分配不同的偏移量。

前端基礎:深入V8引擎的內部及編寫優化代碼的5個技巧

這兩個對象基本相同,但是“a”和“b”屬性的創建順序不同。

編譯成機器碼

一旦 Hydrogen 圖被優化,Crankshaft 將其降低到稱為 Lithium 的較低級表示。大部分的 Lithium 實現都是特定於架構的。寄存器分配往往發生在這個級別。

最後,Lithium 被編譯成機器碼。然後就是 OSR :on-stack replacement(堆棧替換)。在我們開始編譯和優化一個明確的長期運行的方法之前,我們可能會運行堆棧替換。 V8 不只是緩慢執行堆棧替換,並再次開始優化。相反,它會轉換我們擁有的所有上下文(堆棧,寄存器),以便在執行過程中切換到優化版本上。這是一個非常複雜的任務,考慮到除了其他優化之外,V8 最初還將代碼內聯。 V8 不是唯一能夠做到的引擎。

有一種叫去優化的安全措施來進行相反的轉換,並在假設引擎無效的情況下返回未優化的代碼。

垃圾收集

對於垃圾收集,V8採用傳統的 mark-and-sweep 算法 來清理舊一代。 標記階段應該停止JavaScript執行。 為了控制GC成本並使執行更穩定,V8使用

增量標記:不是遍歷整個堆,嘗試標記每個可能的對象,它只是遍歷堆的一部分,然後恢復正常執行。下一個GC停止將從上一個堆行走停止的位置繼續,這允許在正常執行期間非常短暫的暫停,如前所述,掃描階段由單獨的線程處理。

如何編寫優化的 JavaScript

  1. 對象屬性的順序:始終以相同的順序實例化對象屬性,以便可以共享隱藏的類和隨後優化的代碼。
  2. 動態屬性: 因為在實例化之後向對象添加屬性將強制執行隱藏的類更改,並降低之前隱藏類所優化的所有方法的執行速度,所以在其構造函數中分配所有對象的屬性。
  3. 方法:重複執行相同方法的代碼將比僅執行一次的多個不同方法(由於內聯緩存)的代碼運行得更快。
  4. 數組:避免稀疏數組,其中鍵值不是自增的數字,並沒有存儲所有元素的稀疏數組是哈希表。這種數組中的元素訪問開銷較高。另外,儘量避免預分配大數組。最好是
    按需增長。最後,不要刪除數組中的元素,這會使鍵值變得稀疏。
  5. 標記值:V8 使用 32 位表示對象和數值。由於數值是 31 位的,它使用了一位來區分它是一個對象(flag = 1)還是一個稱為 SMI(SMall Integer)整數(flag = 0)。那麼,如果一個數值大於 31 位,V8會將該數字裝箱,把它變成一個雙精度數,並創建一個新的對象來存放該數字。儘可能使用 31 位有符號數字,以避免對 JS 對象的高開銷的裝箱操作。

Ignition and TurboFan

隨著2017年早些時候發佈V8 5.9,引入了新的執行管道。 這個新的管道在實際的JavaScript應用程序中實現了更大的性能提升和顯著節省內存。

新的執行流程是建立在 Ignition( V8 的解釋器)和 TurboFan( V8 的最新優化編譯器)之上的。

自從 V8 5.9 版本問世以來,由於 V8 團隊一直努力跟上新的 JavaScript 語言特性以及這些特性所需要的優化,V8 團隊已經不再使用 full-codegen 和 Crankshaft(自 2010 年以來為 V8 技術所服務)。

這意味著 V8 整體上將有更簡單和更易維護的架構。

前端基礎:深入V8引擎的內部及編寫優化代碼的5個技巧

這些改進只是一個開始。 新的Ignition和TurboFan管道為進一步優化鋪平了道路,這些優化將在未來幾年內提升JavaScript性能並縮小V8在Chrome和Node.js中的佔用空間。


分享到:


相關文章: