恢復時間目標(RTO)和恢復點目標(RPO)的理解差異

如今,災難以多種形式出現。破壞、盜竊、遺失或自然災害都會使企業的應用程序崩潰並破壞其數據。在理想的情況下,企業的數據保護基礎設施可以立即在故障點時間恢復所有的應用程序和數據。

企業可以立即切換故障應用程序,並連續複製其數據以實現接近零的損失。但是這些操作耗費資源並且很昂貴。實際上,IT部門需要根據預算、資源和應用優先級來設置不同的恢復時間和恢復點目標。

人們將這兩個目標稱為恢復時間目標(RTO)和恢復點目標(RPO)。它們是相關的,並且這兩者都是應用程序和數據恢復所必需的。它們也是不同用途的度量指標。

以下討論一下它們是什麼,它們的相似之處和不同之處,以及為什麼需要分析應用程序的優先級來平衡資源和應用程序的可用性。

恢复时间目标(RTO)和恢复点目标(RPO)的理解差异

定義RTO和RPO

(1)RTO:恢復時間目標

RTO指的是應用程序可以中斷或關閉多少時間而不會對業務造成重大損害。有些應用程序可能會停機數天而不會產生嚴重的後果。而一些高優先級的應用程序只能停下來幾秒鐘,否則將會讓企業和客戶難以應對,並導致業務丟失。

RTO不僅僅是業務損失和恢復之間的持續時間。這個目標還包括IT部門必須採取的步驟來恢復應用程序及其數據。如果IT已經投入高優先級應用程序的故障轉移服務,那麼它們可以在幾秒鐘內安全地表達RTO(IT部門必須恢復本地環境,但由於應用程序正在雲中進行處理,因此IT部門可能需要一些時間)。

企業的RTO任務是根據優先級和潛在業務損失對應用程序進行分類,並相應地匹配企業的資源。例如,接近零的RTO的典型計劃將需要故障轉移服務。4小時RTO允許從裸機恢復開始進行本地恢復,並以完整的應用程序和數據可用性結束。對於8小時以上的RTO,IT團隊可以與本地系統集成商簽署維護合同。

(2)RPO:恢復點目標

恢復點目標是指企業的損失容限:在對業務造成重大損害之前可能丟失的數據量。該目標表示為從丟失事件到最近一次在前備份的時間度量。

如果以定期計劃的24小時增量備份全部或大部分數據,那麼在最壞的情況下,企業將丟失24小時的數據。對於某些應用來說,這是可以接受的,對於其他人來說並不是這樣。

例如,如果企業的應用程序具有4小時RPO,那麼備份和數據丟失之間的最大間隔時間將為4小時。擁有4小時的RPO並不一定意味著企業將失去4小時的數據。例如一個文字處理應用程序在午夜停止運行並在凌晨出現故障,那麼可能沒有丟失太多(或任何)數據。但是如果一個任務繁忙的應用程序在上午10點關閉並且直到下午2點才恢復,那麼企業可能會失去4個小時的高價值並且可能無法替代的數據。在這種情況下,需要進行更加頻繁的備份,以便訪問特定於應用程序的RPO。

這取決於應用優先級,單個RPO的範圍通常為24小時、12小時、8小時、4小時。以秒為單位測量到接近零。只要對生產系統的影響最小,8小時以上的RPO就可以利用現有的備份解決方案。4小時的RPO將需要計劃的快照複製,而接近零的RPO將需要連續複製。在RPO和RTO都接近於零的情況下,將連續複製與故障轉移服務結合使用,以實現接近100%的應用程序和數據可用性。

RTO和RPO如何相似以及不同的原因

(1)RTO和RPO的幾個特徵

恢復時間和恢復點目標因應用程序和數據優先級而異。即使是規模和實力最強的公司也不能為所有應用程序提供接近零的RTO或RPO,也不應該這樣做。

確保100%正常運行時間(RTO)和沒有丟失數據(RPO)的唯一方法是投資連續數據複製功能的故障轉移虛擬環境。

IT優先處理應用程序和數據以匹配所實現的RTO和RPO的費用。請注意,優先事項不僅取決於收入,還取決於風險。企業可能不經常使用應用程序,但如果其數據受到管制,那麼數據丟失可能會導致鉅額罰款。

RTO和RPO均以時間為單位進行測量。對於RTO來說,其度量標準是應用程序失敗和包括數據恢復在內的完整可用性之間的時間量。RPO也以時間單位來衡量。度量標準是數據丟失和前一次備份之間的時間間隔。對於RTO和RPO來說,其應用程序/數據優先級可直接轉換為更短的時間單位。

(2)RTO和RPO的目標存在巨大的差異

儘管它們有相似之處,但RPO和RTO服務於不同的目標。RTO涉及應用程序和系統,但主要描述應用程序停機時間的限制。

RPO主要與失敗事件後丟失的數據量有關。但是,損失數十萬美元的客戶交易將是災難性的後果。

RTO和RPO在行動中的實例

單一文件恢復:例如一家公司員工意外刪除一個時間敏感的電子郵件,然後清空回收站和文件夾的內容。由於Microsoft Exchange是這家公司的業務關鍵型應用程序,因此IT部門不斷支持Exchange中的增量更改。而且由於他們的備份應用程序能夠進行精細的備份和恢復,他們可以在5分鐘的RTO內恢復單個文件,而不用為單個文件恢復整個虛擬機。

電子商務網站:例如,一家零售商店的自營電子商務網站使用三種不同的數據庫:存儲產品目錄的關係數據庫,報告歷史訂單數據的文檔數據庫,以及連接到其支付處理器網關的API數據庫。文件數據庫可以重建來自其他數據庫的數據,因此其RTO和RPO是在24小時內。該業務每週只向關係數據庫添加一次產品,因此RPO並不重要。 其RTO是如果數據庫關閉,則客戶交易停止。

為了保持高可用性,這家商店採用了故障轉移服務,因此數據庫立即在虛擬服務器上運行。該公司將其在一週內進行的少量更改複製到其提供商的災難恢復平臺。API數據庫包含訂購信息,並且需要幾秒鐘才能完成RPO和RTO。 IT部門不斷地將數據複製到故障轉移站點,如果API數據庫停機,該站點將立即接管處理。

成本考慮

調查表明,年收入1億美元的公司在24小時宕機期間將損失約275,000美元。而將在4小時快照複製計劃中損失約45,000美元,使用接近於零的連續複製的損失約為7600美元。

實際上,這個數量可能會更小或更大,具體取決於企業一天中的時間和應用程序活動。繁忙的任務或業務關鍵應用程序會比不太頻繁的應用程序丟失更多的數據和更高優先級的數據。

企業需要相應地規劃RPO和RTO,並在需要之前購買所需的資源。就像購買保險一樣,企業可能永遠不必使用它們,但可能會挽救其業務。


分享到:


相關文章: