06.21 百度，京東，阿里等IT大廠如何做Redis集群方案

2018-06-21 10:35:02 黑馬程序員

為什麼集群

Redis是一個內存數據庫，也就是說存儲數據的容量不能超過主機內存大小。普通主機服務器的內存一般幾十G，但是我們需要存儲大容量的數據（比如上百G的數據）怎麼辦？由於內存大小的限制，使用一臺 Redis 實例顯然無法滿足需求，這時就需要使用多臺 Redis （集群）作為緩存數據庫，才能在用戶請求時快速的進行響應。

Redis集群作為面試官經常問到的問題，可見其重要性。之前在逛博客的時候看到一位作者為“大cc”的一篇博文，詳細解析了大廠的 Redis 集群方案。現在轉載出來，給各位同學參考，拋磚引玉，希望可以加深同學對Redis的理解，更希望同學們可以順利的通過面試。

Redis集群的兩種方式

redis 集群方案主要有兩類，一是使用類 codis 的架構，按組劃分，實例之間互相獨立; 另一套是基於官方的 redis cluster 的方案;

類 codis 的架構

這套架構的特點：

分片算法：基於 slot hash 桶;

分片實例之間相互獨立，每組一個 master 實例和多個 slave;

路由信息存放到第三方存儲組件，如 zookeeper 或 etcd

旁路組件探活

使用這套方案的公司：阿里雲： ApsaraCache, RedisLabs、京東、百度等

codis

slots 方案：劃分了 1024 個 slot， slots 信息在 proxy 層感知; redis 進程中維護本實例上的所有 key 的一個 slot map;

遷移過程中的讀寫衝突處理：最小遷移單位為 key; 訪問邏輯都是先訪問 src 節點，再根據結果判斷是否需要進一步訪問 target 節點;

訪問的 key 還未被遷移：讀寫請求訪問 src 節點，處理後訪問：

訪問的 key 正在遷移：讀請求訪問 src 節點後直接返回; 寫請求無法處理，返回 retry

訪問的 key 已被遷移 (或不存在)：讀寫請求訪問 src 節點，收到 moved 回覆，繼續訪問 target 節點處理

阿里雲

AparaCache 的單機版已開源 (開源版本中不包含 slot 等實現)，集群方案細節未知; ApsaraCache

主要組件：proxy，基於 twemproxy 改造，實現了動態路由表; redis 內核：基於 2.x 實現的 slots 方案; metaserver：基於 redis 實現，包含的功能：拓撲信息的存儲 & 探活; 最多支持 1000 個節點;

slot 方案：redis 內核中對 db 劃分，做了 16384 個 db; 每個請求到來，首先做 db 選擇;

數據遷移實現：數據遷移的時候，最小遷移單位是 slot，遷移中整個 slot 處於阻塞狀態，只支持讀請求，不支持寫請求; 對比官方 redis cluster/ codis 的按 key 粒度進行遷移的方案：按 key 遷移對用戶請求更為友好，但遷移速度較慢; 這個按 slot 進行遷移的方案速度更快;

京東

主要組件：proxy: 自主實現，基於 golang 開發; redis 內核：基於 redis 2.8configServer(cfs) 組件：配置信息存放; scala 組件：用於觸發部署、新建、擴容等請求; mysql：最終所有的元信息及配置的存儲; sentinal(golang 實現)：哨兵，用於監控 proxy 和 redis 實例，redis 實例失敗後觸發切換;

slot 方案實現：在內存中維護了 slots 的 map 映射表;

數據遷移：基於 slots 粒度進行遷移; scala 組件向 dst 實例發送命令告知會接受某個 slot;dst 向 src 發送命令請求遷移，src 開啟一個線程來做數據的 dump，將這個 slot 的數據整塊 dump 發送到 dst(未加鎖，只讀操作) 寫請求會開闢一塊緩衝區，所有的寫請求除了寫原有數據區域，同時雙寫到緩衝區中。當一個 slot 遷移完成後，把這個緩衝區的數據都傳到 dst，當緩衝區為空時，更改本分片 slot 規則，不再擁有該 slot，後續再請求這個 slot 的 key 返回 moved; 上層 proxy 會保存兩份路由表，當該 slot 請求目標實例得到 move 結果後，更新拓撲;

跨機房：跨機房使用主從部署結構; 沒有多活，異地機房作為 slave;

基於官方redis cluster的方案

和上一套方案比，所有功能都集成在 redis cluster 中，路由分片、拓撲信息的存儲、探活都在 redis cluster 中實現; 各實例間通過 gossip 通信; 這樣的好處是簡單，依賴的組件少，應對 400 個節點以內的場景沒有問題 (按單實例 8w read qps 來計算，能夠支持 200 * 8 = 1600w 的讀多寫少的場景); 但當需要支持更大的規模時，由於使用 gossip 協議導致協議之間的通信消耗太大，redis cluster 不再合適;

使用這套方案的有：AWS, 百度貼吧

官方 redis cluster

數據遷移過程：基於 key 粒度的數據遷移; 遷移過程的讀寫衝突處理：從 A 遷移到 B;

訪問的 key 所屬 slot 不在節點 A 上時，返回 MOVED 轉向，client 再次請求 B;

訪問的 key 所屬 slot 在節點 A 上，但 key 不在 A 上，返回 ASK 轉向，client 再次請求 B;

訪問的 key 所屬 slot 在 A 上，且 key 在 A 上，直接處理;(同步遷移場景：該 key 正在遷移，則阻塞)

AWS ElasticCache

ElasticCache 支持主從和集群版、支持讀寫分離; 集群版用的是開源的 Redis Cluster，未做深度定製;

基於 redis cluster + twemproxy 實現; 後被 BDRP 吞併; twemproxy 實現了 smart client 功能; 使用 redis cluster 後還加一層 proxy 的好處：

對 client 友好，不需要 client 都升級為 smart client;(否則，所有語言 client 都需要支持一遍)

加一層 proxy 可以做更多平臺策略; 比如在 proxy 可做大 key、熱 key 的監控、慢查詢的請求監控、以及接入控制、請求過濾等;

即將發佈的 redis 5.0 中有個 feature，作者計劃給 redis cluster 加一個 proxy。

ksarch-saas 對 twemproxy 的改造已開源：https://github.com/ksarch-saas/r3proxy

為了幫助同學們更好的瞭解Redis，小編為同學們準備了Redis的學習教程。

領取方式

1.關注“黑馬程序員” 評論轉發後臺回覆：rd

分享到:

閱讀更多 黑馬程序員 的文章

關鍵字: 內存阿里雲計算數據庫

phpstorm2019.3.4最新激活漢化方法不要錯過

什麼是seo外鏈，它有什麼作用？

產品列表頁簡單說明

【全】阿里，百度，騰訊等一線互聯網公司中，Java開發的招聘標準

指針數組和數組指針的區別，優先級問題

java常見疑難面試題及答案（阿里、螞蟻、百度、美團）（五）

java常見疑難面試題及答案（阿里、螞蟻、百度、美團）（四）

java常見疑難面試題及答案（阿里、螞蟻、百度、美團）（三）

java常見疑難面試題及答案（阿里、螞蟻、百度、美團）（二）

SSO單點登陸基於Session簡單實現

三步搞定批量提取文件名

站群服務器選擇區別方式

百度、京東、網易、騰訊、淘寶等大廠都在用的Web服務器Nginx詳解

bat-入門系列-03-判斷結構2

bat-入門系列-02-循環結構2

bat-入門系列變量2

bat-入門系列-01-變量

bat-字符串分割

bat-寫入文件

bat-複製文件

bat-調用其它批處理文件

bat-刪除文件1

11.24 一週 GitHub 開源項目推薦：百度、愛奇藝……

vue.js 多種打包場景的配置

百度，阿里，騰訊，華為，拼多多面試題《出現率98%》

一個網站，包含你所需的各種實用小工具

百度、新浪架構師花費大量時間整理出來的PHP架構師核心知識

快速一鍵提取文件夾內的文件名？這個方法簡單易操作

一篇乾貨教你什麼叫裝飾器以及如何在訪問特性時執行代碼

前BAT架構師花費一週時間的八大基礎排序總結

SEM賬戶搭建參考思路整理

華為百度騰訊三大公司的python的面試問題真的不要問怎麼來的

圖片不想讓別人看到怎麼辦呢

09.18 網站推廣應避免的5個錯誤

原創：「讓安卓系統更加流暢」zipalign優化工具

我的面經經驗分享（阿里、騰訊、百度、網易等），您get到了嗎？

09.08 SEO免費外鏈收錄查詢網站測評

最全技術面試180題：阿里11面試+網易+百度+美團！含答案大贈送！

如何制定一份詳細的SEO優化方案

Android activity的一些知識乾貨

06.24 JSON.stringify日期過後時間不正確的解決方法

06.12 SQL查詢之多表查詢

06.07 編程初學者遇到問題怎麼解決，用C語言告訴你

06.04 愛快軟路由虛擬機環境搭建

05.18 關於Sitemap的七個問題

04.07 python中logging會重複寫日誌的問題分析

RouterOS屏蔽某個網站的方法

01.24 最新百度雲會員破解加速下載

透過阿里、騰訊、百度，一覽無餘看軟件工程師的煉成記

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"