系統設計中必要知道的一些緩存知識

2020-04-29 17:06:23 架構師之路

本文主要是關於cache的介紹、用例、策略

Data Centre

前言

你有沒有注意到，如果你在緩慢的互聯網中連接和瀏覽一個網站，文本加載之前，任何高質量的圖像都不會加載。然而，在您隨後訪問同一網站時，您會發現頁面呈現很快。當你訪問一個全新的網站，它需要更多的時間來加載比經常訪問的網站，如微信或阿里巴巴。你知道為什麼會這樣嗎?答案是緩存。

Instagram page on a slow internet connection

上面的圖片是我的微博頁面在慢速互聯網連接時的樣子。如您所見，文本數據顯示，而您無法看到圖像，因為頁面仍在呈現。

為用戶提供最佳體驗對於提高用戶留存率和參與度非常重要。在當今競爭激烈的世界中，企業會因為糟糕的用戶體驗而受到影響。想象一下，你正在任何一個視頻流媒體網站上看你最喜歡的電視劇，但是視頻一直在緩衝。你會在這樣的網站上繼續訂閱嗎?

緩存的工作原理是“引用的局部性”。緩存充當數據的本地存儲，以加速查找或檢索。緩存的主要目標是減少讀取延遲並放大任何應用程序的吞吐量。在下一節中，我們來看一個真實的類比。

現實世界中緩存的類比

假設你每天都做飯。你需要不同的配料、蔬菜、香料等來準備食物。但是你每天都去超市買這個嗎?這太麻煩，太耗時了。所以，你要先檢查你的廚房或冰箱，以防你的雜貨堆得太滿。這樣就不用去逛超市了。

Refrigerator behaves as a Cache for vegetables

在這裡，你的冰箱就像是你儲存蔬菜的地方。使用緩存的最大好處是節省了時間，可以快速準備食物。

緩存如何工作

後端應用程序通常將數據存儲在數據庫中。當客戶端獲取任何數據時，應用程序查詢數據庫，獲取數據並將其返回給用戶。數據庫服務器作為一個單獨的進程運行，可以在與應用服務器不同的計算機上運行。

Application Server fetching data from DB

從數據庫讀取數據非常耗時，因為需要網絡調用和IO操作才能從文件系統獲取數據。如果數據存儲在緩存中，讀取操作將非常快。當用戶重複請求相同的數據時，從緩存中獲取數據比從數據庫中獲取數據更有意義。

例如:如果一條微博病毒式傳播，所有的客戶端都會嘗試獲取同一條微博的數據。由於微博擁有數百萬用戶，使用緩存將為數據庫節省數百萬次調用。

此外，緩存還減少了數據庫的負載。如果在緩存中找到數據，就會保存數據庫調用，從而減少數據庫的壓力。簡單地說，可以將緩存看作存儲鍵-值對的哈希表。

下圖說明了從緩存中讀取數據的過程:

Process of reading from Cache

緩存的核心概念

TTL (Time to Live)

可以存儲在緩存中的數據量是有限制的。有必要刪除應用服務器不再需要的緩存中的條目。

在Netflix(網飛)，服務器將緩存最頻繁觀看或最熱門的節目。它不需要存儲那些收視率隨著時間而下降的節目。

例如:在我寫這篇文章的時候，收藏像《王牌對王牌》這樣的電視節目比收藏像《流浪地球》這樣的電影更有意義。

緩存算法

根據應用程序訪問數據的方式，緩存可能在某個時間點被填滿。因此，我們需要想出一個策略來從緩存中刪除數據，並將其替換為將來更有可能被訪問的數據。

有多個緩存清除策略，如LRU(最近最少使用)、LFU(最不經常使用)、MRU(最近使用)。這些策略使用預定義的邏輯從緩存中刪除數據。我們將在下一節中討論上述每一項。

LRU(最近最少使用)

此策略從緩存中刪除最近最少使用的項。一旦緩存滿了，最近最少使用的條目就會被從緩存中移除，而最近使用的條目則會被添加到緩存中。

你可以想象微信把名人的照片儲存在緩存裡。關注者的數據訪問模式是這樣的，他們對最近的照片很感興趣。當緩存被填滿時，它將踢出最近添加的照片。

LFU(最少使用)

LFU跟蹤數據項被訪問的頻率或次數。當緩存大小超過給定的閾值時，它將以最低的頻率驅逐該條目。

當你在發短信的時候輸入任何一個單詞，你的手機就會開始提示你可以選擇多個單詞，而不是輸入整個單詞。在內部，你的手機軟件會對你輸入的所有單詞及其頻率進行緩存。

Phone’s software recommending words to complete

緩存稍後將以最低的頻率清除該單詞。如果多個單詞之間存在關聯，那麼最近最少使用的單詞將被清除。在上面的手機例子中，如果你開始使用“功能”，“功能”，“羽毛”等詞，它將停止向你提示“壯舉”這個詞(因為這將被從緩存中刪除)。

MRU(最近使用)

在MRU中，刪除最近使用的條目，並優先將舊的條目保留在緩存中。如果數據訪問模式使用戶不太可能查看最近的條目，則此策略用於清除。讓我們看一個例子。

Tinder Left/Right Swipe uses the MRU policy

像陌陌這樣的約會應用通常會緩存用戶的所有潛在匹配對象。當用戶向左或向右滑動個人資料時，應用程序不應該再次向用戶推薦相同的個人資料。如果發生這種情況，將會導致糟糕的用戶體驗。

有必要對最近觀察到的條目進行剔除。應用程序必須刪除向右或向左滑動的配置文件的緩存項。

緩存類型

Write Through Cache

顧名思義，數據首先寫入緩存，然後寫入數據庫。這確保了緩存中的數據與數據庫中的數據之間的一致性。在緩存上執行的每次讀操作都是在最近的寫操作之後進行的。

Write Through Cache

但是，這種方法的缺點是應用程序寫延遲增加。這種方法不適合寫得很多的系統。對於那些一旦數據被持久化到數據庫中就頻繁地重新讀取數據的應用程序來說，這是非常有用的。寫延遲可能會受到影響，但它可以通過較低的讀延遲和一致性得到補償

Write Back Cache

從上面可以看出，通過緩存進行寫操作並不適用於寫操作較多的系統，因為延遲可能會增加。另一種方法是先將數據寫入緩存，並將數據標記為已修改(稍後在DB中更新)。

Write Back Cache

異步作業可以定期讀取緩存中的所有修改項，並更新它們在數據庫中的相應值。這種方法既不會影響讀延遲，也不會影響寫延遲。唯一的缺點是緩存和數據庫之間的數據同步會有延遲。由於數據庫是事實的來源，從數據庫中讀取的任何應用程序都將讀取陳舊的條目。

像騰訊視頻這樣的網站使用回寫緩存來存儲任何視頻的瀏覽次數。為病毒視頻的每一個單獨的視圖更新數據庫將是昂貴的。將數據寫入緩存，然後將其同步到數據庫是更好的解決方案。使用回寫緩存可以確保較低的讀/寫延遲。

Write Around Cache

很少有後端應用程序不經常重新讀取最近的數據。在這種情況下，使用了寫入緩存。

Write Around Cache

在此策略中，數據庫在不寫入緩存的情況下更新。這不會加載緩存的數據不會被重新讀取。如果應用程序開始查詢最近的數據，就會導致緩存丟失。

以下是內存中緩存產品的開源列表

Redis
Memcached
VoltDB
Aerospike DBS
Apache Ignite
haproxy for cache

引用自

List of In-memory databases [https://en.wikipedia.org/wiki/List_of_in-memory_databases]
What is Caching? [https://www.cloudflare.com/learning/cdn/what-is-caching/]
Distributed Caching [https://en.wikipedia.org/wiki/Distributed_cache]
Types of Caches [https://www.geeksforgeeks.org/write-through-and-write-back-in-cache/]

分享到:

閱讀更多 架構師之路 的文章

關鍵字: 電腦設計內存

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

系統設計中必要知道的一些緩存知識

前言

現實世界中緩存的類比

緩存如何工作

緩存的核心概念

緩存類型

相關文章:

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Redis內存分析工具--rdr安裝與使用

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

一行代碼提升遷移性能

利用相似幾何信息，做可泛化3D形狀分割模型

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

分佈式緩存，真香

特徵工程的力量

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

SpringBoot如何優雅的使用RocketMQ

css代碼規範工具stylelint

性傳播疾病的原理是什麼？

為什麼有人說愛因斯坦死前燒燬自己的手稿？

美國負債已達21萬億美元，債務違約是否必然？美元霸權會崩潰嗎？

10月4日中國女排跟意大利女排一戰，朱婷賽後累的趴在地上休息了好久，你覺得郎導是否過度使用她了？

你覺得諾貝爾獎的評選標準科學嗎？為什麼？

中國女排遭遇世錦賽首敗，有人說意大利女排賽後拍照伸手指嘲諷中國隊，對此你怎麼看？

日本接連有颱風來襲，交通陷入混亂，為何國內遊客還蜂擁去日旅遊呢？

已取得美國合法身份的華人能否參選總統？

穆里尼奧被曝光很快就要從曼聯下課，據說皇馬有意請他二進宮，你認為他能東山再起嗎？

有人說中國足球寧願花更多的時間去試錯，也不願意踏踏實實的遵循足球發展規律做好青訓，你怎麼看？

跑步不到30分鐘，消耗脂肪嗎？

中風後病人需終身用藥，是一筆不小支出，一般家庭根本無法承受，該怎麼辦？

房子沒有在中介掛售，在不找律師中介的情況下，如何貸款買房？

下崗工人已臨近退休，沒錢繳納養老保險，老年生活如何得到保障？

手錶真假鑑定的小技巧有哪些？

帝舵和歐米伽，哪個檔次高？

如何找對屬於你的腕錶尺寸？

物體分為三態：固態、液態、氣態，那麼光是什麼態？火又是什麼態？

如何評價央視主持人桑晨？

做期貨交易該怎麼培養“盤感”？

華人得諾貝爾獎的不在少數，可國內卻鮮有諾獎得主，你覺得根本原因出在哪裡？

俄羅斯敢不敢派遣轟炸機對美國領土進行繞飛，為什麼？

印度的火車上爬了那麼多人，是不是不用買票了？

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪