Hi 程序員，Web 開源神器瞭解一下？

2019-03-28 10:27:01 CSDN

“用戶體驗也應該包含用戶遇到問題時我們如何快速 debug 和修復，而這對於內網部署並且邏輯非常複雜的應用而言並非易事。”

針對該難題，GitHub 上恰好有個頁面錄製與回放的開源神器——rrweb，這是 SmartX 前端團隊在不斷嘗試解決這一問題後衍生出的技術工具。要說 rrweb 究竟怎麼樣，本文將帶你一探究竟！

作者 | SmartX前端團隊

前段時間開源了我們的 Web 錄製、回放基礎庫 rrweb，它可以將頁面中的 DOM 以及用戶操作保存為可序列化的數據，以實現遠程回放。

研發這一工具起初是為了解決我們在客戶環境 debug 時遇到的一些問題。

我們的產品通常部署在客戶的內網環境中，因此一旦出現問題只能通過各類遠程操作工具登入客戶環境中進行 debug，操作的空間和時間都非常有限。如果不幸遇到一些偶發性問題，復現就變得難上加難，debug 更是無從談起。

在這種情況下，前端的異常監控及對應數據的收集就顯得尤為重要，但是傳統的收集錯誤棧信息的方式並不能給我們提供足夠的信息用於定位問題。

在進一步調研的過程中我們發現 LogRocket（https://logrocket.com/）這樣的工具能夠提供像素級的錄製與回放，非常適用於我們的場景。但該類產品通常為 SAAS 服務，客戶的內網環境很可能無法連接，因此也無法使用。

最終我們決定自行實現 Web 錄製與回放這一套功能，在開發的過程中我們發現它還可以被應用於很多場景，例如：

記錄用戶使用產品的方式並加以分析，進一步優化產品；
採集用戶遇到 bug 的操作路徑，予以復現；
記錄 CI 環境中的 E2E 測試的執行情況；
錄製體積更小、清晰度無損的產品演示。

所以我們把其中最通用的部分作為獨立的代碼倉庫開源，方便其他開發者使用。

下文中將具體說說 rrweb 設計的演進過程以及其中的關鍵技術細節。

回放的基礎：DOM 快照

頁面中的視圖狀態可以通過 DOM 樹的形式描述，所以當我們嘗試錄製一個頁面時，我們實際上是在記錄 DOM 樹在各個時間點上的狀態，在 rrweb 中我們稱一次這樣的狀態記錄為一個快照。

序列化

如果僅僅需要在本地錄製和回放，那麼我們可以簡單地深拷貝 DOM。例如以下的代碼：

javascript
// deep clone document element
const docEl = document.documentElement.cloneNode(true);
// replay later
document.replaceChild(docEl, document.documentElement);

我們通過將 DOM 對象深克隆在內存中就實現了快照。

但是這個快照對象本身並不是可序列化的，因此我們不能將其保存為特定的文本格式（例如 JSON）進行傳輸，也就無法做到遠程錄製。所謂不可序列化是指雖然我們可以通過 innerHTML 等方式獲取到描述 DOM 的文本格式，但其中會丟失一些視圖狀態，例如元素的 value 就不一定會記錄在 HTML 中。

所以我們首先需要實現將 DOM 及其視圖狀態序列化的方法。在這裡我們不使用一些開源方案例如 parse5（https://github.com/inikulin/parse5）的原因包含兩個方面：

1. 我們需要實現一個“非標準”的序列化方法。

2. 此部分代碼需要運行在被錄製的頁面中，要儘可能控制代碼量，只保留必要功能。

之所以說我們的序列化方法是非標準的是因為我們還需要做以下幾部分的處理：

1. 去腳本化，被錄製頁面中的所有 JavaScript 都不應該被執行。

2. 記錄沒有反映在 HTML 中的視圖狀態。例如輸入後的值不會反映在其 HTML 中，我們需要讀取其 value 值並加以記錄。

3. 相對路徑轉換為絕對路徑。回放時頁面 URL 為重放頁面的地址，如果被錄製頁面中有一些相對路徑就會產生錯誤。

4. 儘量記錄 CSS 樣式表的內容。如果被錄製頁面加載了一些同源的樣式表，我們則可以獲取到解析好的 CSS rules，錄製時將能獲取到的樣式都 inline 化，這樣可以讓一些內網環境（如 localhost）的錄製也有比較好的回放效果。

初次嘗試：定時快照

當我們完成了可序列化的 DOM 快照實現之後，映入腦海的第一個思路就是定時對頁面製作快照完成錄製，回放時只需按照時間間隔依次重建快照即可。

但稍加思考之後我們會發現這個方案有兩大弊端。

首先是兩次快照之間的時間間隔難以平衡，如果間隔過短那麼可能產生大量無區別的快照，最終的總體積也會非常大，甚至大於同樣時長的視頻文件；而如果間隔過長那麼就會遺漏兩次間隔之間的視圖變化，可能導致一些關鍵性操作沒有被錄製。

其次是我們無法感知視圖變化的原因，也就無法從中解析出用戶的行為加以分析。

雖然定時快照的方案並不可行，但是指明瞭我們需要解決的兩個核心問題：

1. 應該基於導致視圖的變更製作快照。

2. 要控制錄製結果的體積。

再次嘗試：基於變更製作快照

第一個優化的方向是明確製作快照的時機，應該在每次視圖變更時製作一次快照。這樣既不會有不必要的快照，也不會遺漏視圖變化。

在實際的 Web 應用中視圖的變更非常頻繁，而且絕大部分都是局部的變更，因此每一次變更對應一個完整快照的思路雖然保證了快照數量上沒有浪費，但在每個快照的內容中依然有大量重複的部分，全部記錄下來還是一種不必要的冗餘。

基於快照 diff 的優化思路

為了消除上述快照中的冗餘數據，最直觀的思路就是將每一個快照與其前一個快照進行 diff，找出變更的部分加以記錄。

由於我們的快照數據結構是和 DOM 樹相類似的樹狀結構，因此在 DOM 樹較為複雜時 diff 的開銷將會非常高，甚至阻塞被錄製頁面的正常交互，進而影響用戶體驗。

這樣的高侵入性顯然與我們的預期是不相符的，所以我們還需要追溯視圖變更的根本原因——引發變更的操作。

最終錄製方案：快照 + Oplog

我們可以把引發視圖變更的操作歸為以下幾類：

DOM 變動
節點創建、銷燬
節點屬性變化
文本變化
鼠標交互
頁面或元素滾動
視窗大小改變
輸入
鼠標移動（特指鼠標的視覺位置）

對於每個操作我們只需要記錄其操作類型和相關的數據，就可以在回放時重現對應的操作，也就回放了該操作對視圖的改變。

這樣我們只需要在開始錄製時製作一個完整的 DOM 快照，之後則記錄所有的操作數據，這些操作數據我們稱之為 Oplog（operations log），這一思路和 log-structured file system 是類似的。

唯一標識

在分析各類操作需要採集的對應數據之前，我們首先要對之前的序列化快照進行一個拓展：為每一個 DOM 節點添加唯一標識。

想象一下如果我們在本地記錄一次點擊按鈕的操作並回放，我們可以用以下格式記錄該操作：

javascript
type clickOp = {
 source: 'MouseInteraction';
 type: 'Click';
 node: HTMLButtonElement;
}

再通過 clickOp.node.click() 就能將操作再執行一次。

但是在遠程場景中，雖然我們已經重建出了完整的 DOM，但是卻沒有辦法將 Oplog 中被交互的 DOM 節點和已存在的 DOM 關聯在一起。

這就是唯一標識 id 的作用，我們在錄製端和回放端維護一致的 id -> Node 映射，上述示例中的數據結構相應的變為：

typescript
type clickSnapshot = {
 source: 'MouseInteraction';
 type: 'Click';
 id: Number;
}

DOM 變動

以下場景在 Web 應用中隨處可見：

點擊 button，出現 dropdown menu，選擇第一項，dropdown menu 消失

因為回放時不會有 JavaScript 腳本執行這一動態變化，所以對於這一操作需要記錄 DOM 節點的創建以及後續的銷燬，這也是錄製中的最大難點。

好在現代瀏覽器已經給我們提供了非常強大的 API ——MutationObserver（https://developer.mozilla.org/en-US/docs/Web/API/MutationObserver）用來完成這一功能。

我們不會具體講解 MutationObserver 的基本使用方式，只專注於在 rrweb 中我們需要做哪些特殊處理。

首先要了解 MutationObserver 的觸發方式為批量異步回調，具體來說就是會在一系列 DOM 變化發生之後將這些變化一次性回調，傳出的是一個 mutation 記錄數組。

例如以下兩種操作會生成相同的 DOM 結構，但是產生不同的 mutation 記錄：

body
 n1
 n2

1. 創建節點 n1 並 append 在 body 中，再創建節點 n2 並 append 在 n1 中。

2. 創建節點 n1、n2，將 n2 append 在 n1 中，再將 n1 append 在 body 中。

第 1 種情況將產生兩條 mutation 記錄，分別為增加節點 n1 和增加節點 n2；第 2 種情況則只會產生一條 mutation 記錄，即增加節點 n1。

想要同時正確地處理這兩種情況，所有 mutation 記錄都需要先收集，在新增節點去重並序列化之後再做處理。

鼠標移動

通過記錄鼠標移動位置，我們可以在回放時模擬鼠標移動軌跡。

保證回放時鼠標移動流暢的同時也要儘量減少對應 Oplog 的數量，所以我們會做兩層節流處理。第一層是每 50ms 最多記錄一次鼠標座標，第二層是每 500ms 最多發送一次鼠標座標集合，第二層的主要目的是避免一次請求內容過多而做的分段。

輸入

我們需要觀察、 <textarea>、 <select> 三種元素的輸入，包含人為交互和程序設置兩種途徑的輸入。/<select>/<textarea>

人為交互

對於人為交互的操作我們主要靠監聽 input 和 change 兩個事件觀察，需要注意的是對不同事件但值相同的情況進行去重。此外也是一類特殊的控件，如果多個 radio 元素的組件 name 屬性相同，那麼當一個被選擇時其他都會被反選，但是不會觸發任何事件，因此我們需要單獨處理。

程序設置

通過代碼直接設置這些元素的屬性也不會觸發事件，我們可以通過劫持對應屬性的 setter 來達到監聽的目的。

為了避免我們在 setter 中的邏輯阻塞被錄製頁面的正常交互，我們應該把邏輯放入 event loop 中異步執行。

特定場景優化：多個快照

快照 + Oplog 的設計也有其弊端，比較明顯的缺陷在於長時間的錄製 Oplog 會記錄很多操作，並且由於以增量的形式記錄數據，所以必須用完整的 Oplog 才能夠進行回放。

一類常見的需求是當異常發生時，收集異常之前一段時間的行為數據。為了更好地處理這類需求，我們實現了按時間和按次數重新制作快照的配置。

可以設置每 n 次操作後製作一次快照或每 n 毫秒後製作一次快照，從而將一個長的 Oplog 拆分為多個短的 Oplog。

回放

在確定了最終錄製方案之後，我們就可以實現對應的回放功能。相對來說回放的思路更為明確，可以分為以下 3 個主要步驟：

1. 在一個沙盒環境中將快照重建為對應的 DOM 樹；

2. 將 Oplog 中的操作按照時間戳排列，放入一個操作隊列中；

3. 啟動一個計時器，不斷檢查操作隊列，將到時間的操作取出重現。

沙盒

在序列化設計中我們提到了“去腳本化”的處理，即在回放時我們不應該執行被錄製頁面中的 JavaScript，在重建快照的過程中我們將所有>

因此我們通過 HTML 提供的 iframe 沙盒功能進行瀏覽器層面的限制。

我們在重建快照時將被錄製的 DOM 重建在一個 iframe 元素中，通過設置它的 sandbox 屬性，我們可以禁止以下行為：

表單提交
window.open 等彈出窗
JS 腳本（包含 inline event handler 和）

這與我們的預期是相符的，尤其是對 JS 腳本的處理相比自行實現會更加安全、可靠。

高精度計時器

之所以強調回放所用的計時器是高精度的，是因為原生的 setTimeout 並不能保證在設置的延遲時間之後準確執行，例如主線程阻塞時就會被推遲。

對於我們的回放功能而言，這種不確定的推遲是不可接受的，可能會導致各種怪異現象的發生，因此我們通過 requestAnimationFrame 來實現一個不斷校準的定時器，確保絕大部分情況下操作的重放延遲不超過一幀。

同時自定義的計時器也是我們實現“快進”功能的基礎。

最後，另附項目地址：

官網鏈接：https://www.rrweb.io

GitHub 鏈接：https://github.com/rrweb-io/rrweb

作者：SmartX前端團隊。SmartX 是國內超融合基礎架構領域的技術領導者，其前端團隊專注於開發高質量的企業級 Web 應用開發，持續不斷地探索和創新，最終將技術落地，提升用戶體驗。

分享到:

閱讀更多 CSDN 的文章

關鍵字: JSON 開源設計

程序員：一篇文章弄懂Java多線程基礎和Java內存模型

程序員：最近一直在思考，線程安全與性能的權衡

程序員：今天想要讓你搞懂static 靜態變量，靜態方法，靜態塊

程序員，請停止學習框架！

程序員：一文掌握java集合框架的Collection接口

程序員：學了那麼久Python是否要放棄

程序員，拯救我的C盤

程序員：php7實戰開發youtube全球最大視頻網站

程序員：用php兩個小時開發了一個百度搜索引擎

03.08 程序員：用php兩個小時開發了一個百度搜索引擎

程序員：單個TCP（Socket）連接，發送多個文件

程序員：學會springboot多環境配置方案不用5分鐘

程序員：SpringBoot和Redis實現Java緩存技術

@程序員，如果你熱愛編碼，就應該少寫代碼

12.23 @程序員，如果你熱愛編碼，就應該少寫代碼

程序員：RPC遠程調用原理淺析

12.14 程序員：RPC遠程調用原理淺析

程序員：JSON學習，FastJson和Jackson對null的處理

程序員：IDEA創建JavaWeb項目及打包發佈到遠程服務器

程序員，被代碼耽誤的段子手

程序員，為什麼千萬不要重寫代碼？

@程序員，React 使用如何避坑？

做十年 Windows 程序員 VS 做10年 Linux 程序員，到底誰厲害？

09.24 程序員：不能逃避的synchronize和volatile

這樣的網站驗證碼很“程序員”，網友直呼註冊門檻太高了！

程序員，Mybatis 你踩過坑嗎？

騰訊面試，面試官第一個問題是Int佔多少字節，程序員......

程序員：我莫不是被面試官黑了吧？對答如流都被刷掉了？

怎麼才能成為一名優秀的C++程序員？

程序員：給初學python的朋友的一封信

程序員，你碰到過的最難調的Bug是什麼樣的？

程序員，拒絕無聊的代碼面試！

java和JavaScript啥關係？程式設計師：像馬雲和馬如雲

程式設計師：請你不要對業務邏輯「嗤之以鼻」

程序員：Java字節流與字符流的區別

程式設計師：那些年找工作入過的坑！避雷！

08.24 程序員：我心目中的優秀產品經理

08.21 程序員：每天三道面試題(MySQL查詢語句優化）（三十二）

機器學習可以「指紋」程式設計師

程式設計師「水」與"不水！"給他安排個debug任務試試就知道！

Java過時了？程式設計師：不存在的

程序員：做互聯網一定會遇到三大無法迴避的問題：生、死、騰訊！

程式設計師：分享幾個好玩的東東（上）

請優化你的代碼，程序員：去，隨時都在趕進度還搞什麼優化！

程式設計師：推薦書單

程式設計師：刪了你的代碼吧，世界會變的不一樣

程序員：10個妨礙進步的學習方式

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"