螞蟻技術專家：同爲分布式緩存，爲何 Redis 更勝一籌？

2018-07-13 21:09:33 JAVA技術程序員

如今，市面上的緩存解決方案已經逐步成熟了，今天我將選取其中一些代表性的方案包括Redis、Memcached和Tair進行對比，幫助大家在生產實踐中更好地進行技術選型。

一、常用的分佈式緩存的對比

常用的分佈式緩存包括Redis、Memcached和阿里巴巴的Tair（見下表），因為Redis提供的數據結構比較豐富且簡單易用，所以Redis的使用廣泛。

下面我們從9個大方面來對比最常用的Redis和Memcached。

1．數據類型

Redis一共支持5種數據類型，每種數據類型對應不同的數據結構，有簡單的String類型、壓縮串、字典、跳躍表等。跳躍表是比較新型的數據結構，常用於高性能的查找，可以達到log2N的查詢速度，而且跳躍表相對於紅黑樹，在更新時變更的節點較少，更易於實現併發操作。

Memcache只支持對鍵值對的存儲，並不支持其它數據結構。

2．線程模型

Redis使用單線程實現，Memcache等使用多線程實現，因此我們不推薦在Redis中存儲太大的內容，否則會阻塞其它請求。

因為緩存操作都是內存操作，只有很少的計算操作，所以在單線程下性能很好。Redis實現的單線程的非阻塞網絡I/O模型，適合快速地操作邏輯，有複雜的長邏輯時會影響性能。對於長邏輯應該配置多個實例來提高多核CPU的利用率，也就是說，可以使用單機器多端口來配置多個實例，官方的推薦是一臺機器使用8個實例。

它實現的非阻塞I/O模型基於Libevent庫中關於Epoll的兩個文件加上自己簡單實現的事件通知模型，簡單小巧，作者的思想就是保持實現簡單、減少依賴。由於在服務器中只有一個線程，因此提供了管道來合併請求和批量執行，縮短了通信消耗的時間。

Memcache也使用了非阻塞I/O模型，但是使用了多線程，可以應用於多種場景，請求的邏輯可大可小、可長可短，不會出現一個邏輯複雜的請求阻塞對其它請求的響應的場景。它直接依賴Libevent庫實現，依賴比較複雜，損失了在一些特定環境下的高性能。

3．持久機制

Redis提供了兩種持久機制，包括RDB和AOF，前者是定時的持久機制，但在出現宕機時可能會出現數據丟失，後者是基於操作日誌的持久機制。

Memcahe並不提供持久機制，因為Memache的設計理念就是設計一個單純的緩存，緩存的數據都是臨時的，不應該是持久的，也不應該是一個大數據的數據庫，緩存未命中時回源查詢數據庫是天經地義的，但可以通過第三方庫MemcacheDB來支持它的持久性。

4．客戶端
常見的Redis Java客戶端Jedis使用阻塞I/O，但可以配置連接池，並提供了一致性哈希分片的邏輯，也可以使用開源的客戶端分片框架Redic。
Memecache的客戶端包括Memcache Java Client、Spy Client、XMemcache等，Memcache Java Client使用阻塞I/O，而Spy Client/XMemcache使用非阻塞I/O。
我們知道，阻塞I/O不需要額外的線程，非阻塞I/O會開啟額外的請求線程（在Boss線程池裡）監聽端口，一個請求在處理後就釋放工作者線程（在Worker線程池中），請求線程在監聽到有返回結果時，一旦有I/O返回結果就被喚醒，然後開始處理響應數據並寫回網絡Socket連接，所以從理論上來講，非阻塞I/O的吞吐量和響應能力會更高。
5．高可用
Redis支持主從節點複製配置，從節點可使用RDB和緩存的AOF命令進行同步和恢復。Redis還支持Sentinel和Cluster（從3.0版本開始）等高可用集群方案。
Memecache不支持高可用模型，可使用第三方Megagent代理，當一個實例宕機時，可以連接另外一個實例來實現。
6．對隊列的支持
Redis本身支持lpush/brpop、publish/subscribe/psubscribe等隊列和訂閱模式。
Memcache不支持隊列，可通過第三方MemcachQ來實現。
7．事務
Redis提供了一些在一定程度上支持線程安全和事務的命令，例如：multi/exec、watch、inc等。由於Redis服務器是單線程的，任何單一請求的服務器操作命令都是原子的，但跨客戶端的操作並不保證原子性，所以對於同一個連接的多個操作序列也不保證事務。
Memcached的單個命令也是線程安全的，單個連接的多個命令序列不是線程安全的，它也提供了inc等線程安全的自加命令，並提供了gets/cas保證線程安全。
8．數據淘汰策略
Redis提供了豐富的淘汰策略，包括maxmemory、maxmemory-policy、volatile-lru、allkeys-lru、volatile-random、allkeys-random、volatile-ttl、noeviction(return error)等。
Memecache在容量達到指定值後，就基於LRU（Least Recently Used）算法自動刪除不使用的緩存。在某些情況下LRU機制反倒會帶來麻煩，會將不期待的數據從內存中清除，在這種情況下啟動Memcache時，可以通過“M”參數禁止LRU算法。
9．內存分配
Redis為了屏蔽不同平臺之間的差異及統計內存佔用量等，對內存分配函數進行了一層封裝，在程序中統一使用zmalloc、zfree系列函數，這些函數位於zmalloc.h/zmalloc.c文件中。封裝就是為了屏蔽底層平臺的差異，同時方便自己實現相關的統計函數。具體的實現方式如下：
若系統中存在Google的TC_MALLOC庫，則使用tc_malloc一族的函數代替原本的malloc一族的函數。
若當前系統是Mac系統，則使用系統的內存分配函數。
對於其它情況，在每一段分配好的空間前面同時多分配一個定長的字段，用來記錄分配的空間大小，通過這種方式來實現簡單有效的內存分配。
Memcache採用slab table的方式分配內存，首先把可得的內存按照不同的大小來分類，在使用時根據需求找到最接近於需求大小的塊分配，來減少內存碎片，但是這需要進行合理配置才能達到效果。
從上面的對比可以看到，Redis在實現和使用上更簡單，但是功能更強大，效率更高，應用也更廣泛。下面將對Redis進行初步介紹，給初學者一個初體驗式的學習引導。
二、Redis初體驗
Redis是一個能夠存儲多種數據對象的開源Key-Value存儲系統，使用ANSI C語言編寫，可以僅僅當作內存數據庫使用，也可以作為以日誌為存儲方式的數據庫系統，並提供多種語言的API。
1．使用場景
我們通常把Redis當作一個非本地緩存來使用，很少用到它的一些高級功能。在使用中最容易出問題的是用Redis來保存JSON數據，因為Redis不像Elasticsearch或者PostgreSQL那樣可以很好地支持JSON數據。所以我們經常把JSON當作一個大的String直接放到Redis中，但現在的JSON數據都是連環嵌套的，每次更新時都要先獲取整個JSON，然後更改其中一個字段再放上去。
一個常見的JSON數據的Java對象定義如下：
public class Commodity {
private long price;
private String title;
……
}
在海量請求的前提下，在Redis中每次更新一個字段，比如銷量字段，都會產生較大的流量。在實際情況下，JSON字符串往往非常複雜，體積達到數百KB都是有可能的，導致在頻繁更新數據時使網絡I/O跑滿，甚至導致系統超時、崩潰。
因此，Redis官方推薦採用哈希來保存對象，比如有3個商品對象，ID分別是123、124和12345，我們通過哈希把它們保存在Redis中，在更新其中的字段時可以這樣做：
HSET commodity:123 price 100
HSET commodity:124 price 101
HSET commodity:12345 price 101
HSET commodity:123 title banana
HSET commodity:124 title apple
HSET commodity:12345 title orange
也就是說，用商品的類型名和ID組成一個Redis哈希對象的KEY。在獲取某一屬性時只需這樣做就可以獲取單獨的屬性： HGET commodity: 12345。
2．Redis的高可用方案：哨兵
Redis官方推出了一個集群管理工具，叫作哨兵（Sentinel），負責在節點中選出主節點，按照分佈式集群的管理辦法來操作集群節點的上線、下線、監控、提醒、自動故障切換（主備切換），且實現了著名的RAFT選主協議，從而保證了系統選主的一致性。
這裡給出一個哨兵的通用部署方案。哨兵節點一般至少要部署3份，可以和被監控的節點放在一個虛擬機中，常見的哨兵部署如圖所示。
在這個系統中，初始狀態下的機器A是主節點，機器B和機器C是從節點。
由於有3個哨兵節點，每個機器運行1個哨兵節點，所以這裡設置quorum = 2，也就是在主節點無響應後，有至少兩個哨兵無法與主節點通信，則認為主節點宕機，然後在從節點中選舉新的主節點來使用。
在發生網絡分區時，若機器A所在的主機網絡不可用，則機器B和機器C上的兩個Sentinel實例會啟動failover並把機器B選舉為主節點。
Sentinel集群的特性保證了機器B和機器C上的兩個Sentinel實例得到了關於主節點的最新配置。但機器A上的Sentinel節點依然持有舊的配置，因為它與外界隔離了。
在網絡恢復後，我們知道機器 A 上的 Sentinel 實例將會更新它的配置。但是，如果客戶端所連接的主機節點也被網絡隔離，則客戶端將依然可以向機器 A 的 Redis 節點寫數據，但在網絡恢復後，機器 A 的 Redis 節點就會變成一個從節點，那麼在網絡隔離期間，客戶端向機器 A的 Redis 節點寫入的數據將會丟失，這是不可避免的。
如果把 Redis 當作緩存來使用，那麼我們也許能容忍這部分數據的丟失，但若把 Redis 當作一個存儲系統來使用，就無法容忍這部分數據的丟失了，因為 Redis 採用的是異步複製，在這樣的場景下無法避免數據的丟失。
在這裡，我們可以通過以下配置來配置每個Redis實例，使得數據不會丟失：
min-slaves-to-write 1
min-slaves-max-lag 10
通過上面的配置，當一個Redis是主節點時，如果它不能向至少一個從節點寫數據（上面的min-slaves-to-write指定了slave的數量），則它將會拒絕接收客戶端的寫請求。由於複製是異步的，所以主節點無法向從節點寫數據就意味著從節點要麼斷開了連接，要麼沒在指定的時間內向主節點發送同步數據的請求。
所以，採用這樣的配置可排除網絡分區後主節點被孤立但仍然寫入數據，從而導致數據丟失的場景。
3．Redis集群
Redis在3.0中也引入了集群的概念，用於解決一些大數據量和高可用的問題，但是，為了達到高性能的目的，集群不是強一致性的，使用的是異步複製，在數據到主節點後，主節點返回成功，數據被異步地複製給從節點。
首先，我們來學習Redis的集群分片機制。Redis使用CRC16(key) mod 16384進行分片，一共分16384個哈希槽，比如若集群有3個節點，則我們按照如下規則分配哈希槽：
A節點包含0-5500的哈希槽；
B節點包含5500-11000的哈希槽；
C節點包含11000-16384的哈希槽。
這裡設置了3個主節點和3個從節點，集群分片如圖所示。

圖中共有3個Redis主從服務器的複製節點，其中任意兩個節點之間都是相互連通的，客戶端可以與其中任意一個節點相連接，然後訪問集群中的任意一個節點，對其進行存取和其他操作。
那Redis是怎麼做到的呢？首先，在Redis的每個節點上都會存儲哈希槽信息，我們可以將它理解為是一個可以存儲兩個數值的變量，這個變量的取值範圍是0-16383。根據這些信息，我們就可以找到每個節點負責的哈希槽，進而找到數據所在的節點。
Redis集群實際上是一個集群管理的插件，當我們提供一個存取的關鍵字時，就會根據CRC16的算法得出一個結果，然後把結果除以16384求餘數，這樣每個關鍵字都會對應一個編號為0-16383的哈希槽，通過這個值找到對應的插槽所對應的節點，然後直接自動跳轉到這個對應的節點上進行存取操作。但是這些都是由集群的內部機制實現的，我們不需要手工實現。
最後：
為了讓學習變得輕鬆、高效，今天給大家免費分享一套阿里架構師傳授的一套教學資源。幫助大家在成為架構師的道路上披荊斬棘。
這套視頻課程詳細講解了（Spring，MyBatis，Netty源碼分析，高併發、高性能、分佈式、微服務架構的原理，JVM性能優化、分佈式架構）等這些成為架構師必備的內容！
而且還把框架需要用到的各種程序進行了打包，根據基礎視頻可以讓你輕鬆搭建分佈式框架環境，像在企業生產環境一樣進行學習和實踐。
後臺私信回覆 “ 架構 ” 就可以馬上免費獲得這套價值一萬八的內部教材！

分享到:

閱讀更多 JAVA技術程序員 的文章

關鍵字: 更勝一籌 JSON Memcached

相關文章:

Redis 創始人宣佈 Redis 6.0.0 穩定版正式 GA

【開源推薦】Redis 桌面管理工具RedisDesktopManager2020.0 發佈

高頻Redis面試題解析：Redis 事務是否具備原子性？

Redis 的多線程版本比 Redis 本身要快 5 倍

Redis zset內部實現

Redis 壓力測試

Redis 高可用

Redis 緩存

Redis Set和ZSet常用命令

Redis 的數據淘汰策略

Redis 的持久化底層如何實現的和優點缺點

Redis Hash和List常用命令

驚呆了，竟然可以用這種方式秒建 Redis 集群？

redis 安裝及隊列應用測試

關於緩存穿透、緩存擊穿、緩存雪崩的模擬與解決(Redis)

Redis 官網昨日宕機，錯誤提示為無法連接 Redis

Redis 位圖基礎到統計活躍用戶

redis 常用7種數據類型的使用場景解析

Redis Cluster 3.0集群部署與使用

Redis 講解系列之與Spring集成

Redis 如何處理已過期的元素？

01.21 「Redis 乾貨」如何將 Redis 的內存優化？

「Redis」Redis 基礎

12.24 面試必問：Redis 是如何進行主從複製的？

Redis 複製搭建

Redis 的 Sentinel

12.03 redis 安裝啟動

12.02 Redis-AOF持久化

Redis 面試熱點：什麼是 Redis 的雪崩、穿透和擊穿？（附筆記）

Redis 持久化

Redis 消息隊列的實現和區別

Redis 一站式管理平臺

redis 延時隊列

基於 Electron 的 Redis 圖形化客戶端 k-Redis 數

基於 Electron 的 Redis 圖形化客戶端 k-Redis

Redis 分佈式鎖的正確實現方式（Java版）

redis 常見數據結構實現

redis 中如何切換db

Redis 集群分佈式鎖與 API 網關分佈式限流

Redis 內存淘汰機制詳解

Redis 5 有序集合新增命令

Redis 殺死許可證：RediSearch、Redis Graph 等五個項目閉源

Redis Sentinel機制與用法說明

Redis 基本數據類型

05.08 高級的 Redis Java客戶端-Lettuce

12.19 Redis 隊列

Redis 隊列

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

I

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

1.

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

//

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"