02.04 NoSQL：一文讓你明白Redis主從同步

2019-02-04 10:11:00 牛旦教育IT課堂

今天想和大家分享有關 Redis 主從同步（也稱「複製」）的內容。

我們知道，當有多臺 Redis 服務器時，肯定就有一臺主服務器和多臺從服務器。一般來說，主服務器進行寫操作，從服務器進行讀操作。

那麼這裡有存在一個問題：從服務器如何和主服務器進行數據同步的呢？

這個問題，就是通過今天的內容：主從同步來解決的。

文章內容依舊比較幹，一共 3k+ 字，建議大家靜下心來專心看，文末會給大家做個簡單總結歸納。

1. 如何進行主從同步

假如，現在有 2 臺 Redis 服務器，地址分別是 127.0.0.1:6379 和 127.0.0.1:12345

我們在 127.0.0.1:12345 的客戶端輸入命令：

127.0.0.1:12345> SLAVEOF 127.0.0.6379

如此 127.0.0.1:12345 服務器就會去複製 127.0.0.1:6379 的數據。即前者是從服務器，後者為主服務器。

除了以上方式進行復制之外，還可以通過配置文件中的 slaveof 選項進行設置。

可能，求知慾爆棚的你會想知道，Redis 是怎麼進行主從同步的？

ok，下面我們繼續瞭解一下。

2. 主從同步的實現過程

主從同步分為 2 個步驟：同步和命令傳播

同步：將從服務器的數據庫狀態更新成主服務器當前的數據庫狀態。（數據庫狀態在這篇文章開頭有提到是什麼意思，不清楚的小夥伴可以先看下：一文讓你明白Redis持久化）
命令傳播：當主服務器數據庫狀態被修改後，導致主從服務器數據庫狀態不一致，此時需要讓主從數據同步到一致的過程。

上面就是主從同步 2 個步驟的作用，下面我打算稍微細說這兩個步驟的實現過程。

這裡需要提前說明一下：在 Redis 2.8 版本之前，進行主從複製時一定會順序執行上述兩個步驟，而從 2.8 開始則可能只需要執行命令傳播即可。在下文也會解釋為什麼會這樣？

2.1 同步

從服務器對主服務的同步操作，需要通過 sync 命令來實現，以下是 sync 命令的執行步驟：

1. 從服務器向主服務器發送 sync 命令

2. 收到 sync 命令後，主服務器執行 bgsave 命令，用來生成 rdb 文件，並在一個緩衝區中記錄從現在開始執行的寫命令。

3. bgsave 執行完成後，將生成的 rdb 文件發送給從服務器，用來給從服務器更新數據

4. 主服務器再將緩衝區記錄的寫命令發送給從服務器，從服務器執行完這些寫命令後，此時的數據庫狀態便和主服務器一致了。

用圖表示就是這樣的：

2.2 命令傳播

經過同步操作，此時主從的數據庫狀態其實已經一致了，但這種一致的狀態的並不是一成不變的。

在完成同步之後，也許主服務器馬上就接受到了新的寫命令，執行完該命令後，主從的數據庫狀態又不一致。

為了再次讓主從數據庫狀態一致，主服務器就需要向從服務器執行命令傳播操作，即把剛才造成不一致的寫命令，發送給從服務器去執行。從服務器執行完成之後，主從數據庫狀態就又恢復一致了。

這裡插播一個疑問：

不知道有沒有的讀者覺得，當發生上述不一致的情況後，Redis 再執行同步操作不就 ok 了嗎？

從效果上來說，的確是可以恢復同步，但其實沒有必要。原因是實現同步的 sync 命令是一個非常消耗資源的操作，看完下圖的說明，相信你肯定理解的。

既然同步是一個非常消耗資源的操作，那 Redis 有沒有什麼優化方法呢？答案當然是有的。

2.3 優化版同步操作

還記得上面說的內容嗎 —— 2.8 版本開始，進行主從同步可能只需要執行命令傳播即可。這個也是因為 sync 比較耗資源，從而採取的優化。

那什麼時候可以這麼做呢？我們先看下前提條件：

主從同步實際分 2 種情況：

初次複製：從服務器第一次複製當前主服務器（PS：主服務器是有可能更換的）
斷線後重複製：處於命令傳播階段的主從服務器，因為網絡問題而中斷複製，從服務器通過自動重連，重新連接上主服務器並繼續複製。

在斷線後重複製的情況下，在 2.8 版本之前，會再次執行同步（sync 命令）和命令傳播。

如果說，在斷線期間，主服務器（已有上萬鍵值對）只執行了幾個寫命令，為了讓從服務器彌補這幾個命令，卻要重新執行 sync 來生成新的 rdb 文件，這也是非常低效的。

為了解決這個問題，2.8 開始就使用 psync 命令來代替 sync 命令去執行同步操作。

psync 具有完整重同步和部分重同步兩種模式：

完整重同步：用於初次複製情況，執行過程同 sync，在這不贅述了。
部分重同步：用於斷線後重複製情況，如果滿足一定條件，主服務器只需要將斷線期間執行的寫命令發送給從服務器即可。

因此很明顯，當主從同步出現斷線後重複製的情況，psync 的部分重同步模式可以解決 sync 的低效情況。

上面的介紹中，出現了「滿足一定條件」，那又是鬼什麼條件呢？—— 其實就是一個偏移量的比較，具體可以繼續往下看。

2.4 部分重同步的實現

部分重同步功能由以下 3 部分組成：

主從服務器的複製偏移量
主服務器的複製積壓緩衝區
服務器的運行 id（run id）

2.4.1 複製偏移量

執行復制的主從服務器都會分別維護各自的複製偏移量：

主服務器每次向從服務器傳播 n 個字節數據時，都會將自己的複製偏移量加 n。
從服務器接受主服務器傳來的數據時，也會將自己的複製偏移量加 n

舉個例子：

若當前主服務器的複製偏移量為 10000，此時向從服務器傳播 30 個字節數據，結束後複製偏移量為 10030。

這時，從服務器還沒接收這 30 個字節數據就斷線了，然後重新連接上之後，該從服務器的複製偏移量依舊為 10000，說明主從數據不一致，此時會向主服務器發送 psync 命令。

那麼主服務器應該對從服務器執行完整重同步還是部分重同步呢？如果執行部分重同步的話，主服務器又如何知道同步哪些數據給從服務器呢？

以下答案都和複製積壓緩衝區有關

2.4.2 複製積壓緩衝區

首先，複製積壓緩衝區是一個固定長度，先進先出的隊列，默認 1MB。

當主服務器進行命令傳播時，不僅會將命令發送給從服務器，還會發送給這個緩衝區。

因此複製積壓緩衝區的構造是這樣的：

當從服務器向主服務器發送 psync 命令時，還需要將自己的複製偏移量帶上，主服務器就可以通過這個複製偏移量和複製積壓緩衝區的偏移量進行對比。

若複製積壓緩衝區存在從服務器的複製偏移量 + 1 後的數據，則進行部分重同步，否則進行完整重同步。

2.4.3 run id

運行 id 是在進行初次複製時，主服務器將會將自己的運行 id 發送給從服務器，讓其保存起來。

當從服務器斷線重連後，從服務器會將這個運行 id 發送給剛連接上的主服務器。

若當前服務器的運行 id 與之相同，說明從服務器斷線前複製的服務器就是當前服務器，主服務器可以嘗試執行部分同步；

若不同則說明從服務器斷線前複製的服務器不是當前服務器，主服務器直接執行完整重同步。

花了很多筆墨，終於把部分重同步的實現寫完了，最後補充一個輔助功能

2.5 心跳檢測

剛才提到，主從同步有同步和命令傳播 2 個步驟。

當完成了同步之後，主從服務器就會進入命令傳播階段，此時從服務器會以每秒 1 次的頻率，向主服務器發送命令：REPLCONF ACK <replication> ，其中 replication_offset 是從服務器當前的複製偏移量/<replication>

發送這個命令主要有三個作用：

檢測主從服務器的網絡狀態
輔助實現 min-slaves 選項
檢測命令丟失（若丟失，主服務器會將丟失的寫命令重新發給從服務器）

3. 總結

終於到總結了，我們來總結一下，紀念下我這一個下午的時間。

發送 SLAVEOF 命令可以進行主從同步，比如：SLAVEOF 127.0.0.6379
主從同步有同步和命令傳播 2 個步驟。
同步：將從服務器的數據庫狀態更新成主服務器當前的數據庫狀態（一個消耗資源的操作）
命令傳播：當主服務器數據庫狀態被修改後，導致主從服務器數據庫狀態不一致，此時需要讓主從數據同步到一致的過程
主從同步分初次複製和斷線後重複製兩種情況
從 2.8 版本開始，在出現斷線後重複製情況時，主服務器會根據複製偏移量、複製積壓緩衝區和 run id，來確定執行完整重同步還是部分重同步
2.8 版本使用 psync 命令來代替 sync 命令去執行同步操作。目的是為了解決同步（sync 命令）的低效操作

分享到:

閱讀更多 牛旦教育IT課堂 的文章

關鍵字: 多臺文末 NoSQL

用 Python 寫一個 NoSQL 數據庫

NoSQL 比較及應用場景選擇？

SQL、NoSQL 和 NewSQL，長江後浪推進浪！

03.08 一文讀懂 NoSQL 數據庫

02.25 SpringBoot中文參考指南（2.1.6）32、使用 NoSQL 技術

NoSQL 已死：我們不需要他了

02.17 NoSQL 已死：我們不需要他了

01.12 NoSQL：如何使用NoSQL架構構建實時廣告系統

SQL 已死，NoSQL 才是王道？｜原力計劃

3分鐘瞭解Cloudant NoSQL DB之服務集成（附源碼）

3分鐘瞭解Cloudant NoSQL DB之基本概念

Redis青銅修煉手冊(一) 丨 NoSQL&&Redis介紹

高性能 NoSQL

NOSQL 數據建模技術

深入學習MySQL事務：ACID特性的實現原理

NoSQL 數據庫 mongodbCAP 定理

一文說盡MySQL事務及ACID特性的實現原理

數據：SQL 、 NoSQL 和 NewSQL 的優缺點比較！

天天在講的 NoSQL 數據庫到底是個什麼鬼？

架構技術專題二：網站架構的演化

阿里P8架構師談：MySQL+NoSQL+數據拆分+分布式事務（專題總結）

選擇 NoSQL 資料庫需要考慮的 10 個問題

爲什麼使用 NoSQL：NoSQL 與 SQL 的區別

使用Firebase Firestore和Angular Grid的Ignite UI

常見的網站伺服器架構有哪些？

2018最新BAT技術面試78題：數據結構+網絡+NoSQL+分布式架構！

BAT後端開發36題：Redis、Nosql、Mysql、秒殺題目！含答案福利！

MySQL-海量數量下的查詢效率提升

dubbo使用redis註冊中心的系列問題

07-MyBatis-緩存機制，從一級緩存到二級緩存

Redis 基本數據類型

Redis 中相關Key 操作

建哥手把手系列之30分鐘搞定動態添加刪除redis集羣節點

利用聚合概念指導MongoDB的Schema設計

使用redis的正確姿勢（附代碼）

總結php7操作mongo資料庫的CURD操作

關於RedisPool配置參數你都瞭解嗎？

常見的Redis架構設計缺陷（下）- 緩存擊穿

redis 應用：resque 的基本使用

實際工作中如何保證MongoDB的高性能？

Redis Cluster集羣的搭建與實踐(3)（測試與選舉）

MongoDB4.0支持多文檔ACID事務意味著什麼？

spring boot分佈式鎖組件spring-boot-klock-starter

NoSQL 還是 SQL？這一篇講清楚

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"