聊聊緩存淘汰算法-LRU 實現原理

佚名

2020-11-23 06:52:15

聊聊緩存淘汰算法-LRU 實現原理聊聊緩存淘汰算法-LRU 實現原理前言

我們常用緩存提升數據查詢速度，由於緩存容量有限，當緩存容量到達上限，就需要刪除部分數據挪出空間，這樣新數據才可以添加進來。緩存數據不能隨機刪除，一般情況下我們需要根據某種算法刪除緩存數據。常用淘汰算法有 LRU,LFU,FIFO,這篇文章我們聊聊 LRU 算法。

LRU 簡介

LRU 是 Least Recently Used 的縮寫，這種算法認為最近使用的數據是熱門數據，下一次很大概率將會再次被使用。而最近很少被使用的數據，很大概率下一次不再用到。當緩存容量的滿時候，優先淘汰最近很少使用的數據。

假設現在緩存內部數據如圖所示：

這裡我們將列表第一個節點稱為頭結點，最後一個節點為尾結點。

當調用緩存獲取 key=1 的數據，LRU 算法需要將 1 這個節點移動到頭結點，其餘節點不變，如圖所示。

然後我們插入一個 key=8 節點，此時緩存容量到達上限，所以加入之前需要先刪除數據。由於每次查詢都會將數據移動到頭結點，未被查詢的數據就將會下沉到尾部節點，尾部的數據就可以認為是最少被訪問的數據，所以刪除尾結點的數據。

然後我們直接將數據添加到頭結點。

這裡總結一下 LRU 算法具體步驟：

新數據直接插入到列表頭部緩存數據被命中，將數據移動到列表頭部緩存已滿的時候，移除列表尾部數據。

LRU 算法實現

上面例子中可以看到，LRU 算法需要添加頭節點，刪除尾結點。而鏈表添加節點/刪除節點時間複雜度 O(1)，非常適合當做存儲緩存數據容器。但是不能使用普通的單向鏈表，單向鏈表有幾點劣勢:

每次獲取任意節點數據，都需要從頭結點遍歷下去，這就導致獲取節點複雜度為 O(N)。移動中間節點到頭結點，我們需要知道中間節點前一個節點的信息，單向鏈表就不得不再次遍歷獲取信息。

針對以上問題，可以結合其他數據結構解決。

使用散列表存儲節點，獲取節點的複雜度將會降低為 O(1)。節點移動問題可以在節點中再增加前驅指針，記錄上一個節點信息，這樣鏈表就從單向鏈表變成了雙向鏈表。

綜上使用雙向鏈表加散列表結合體，數據結構如圖所示:

在雙向鏈表中特意增加兩個『哨兵』節點，不用來存儲任何數據。使用哨兵節點，增加/刪除節點的時候就可以不用考慮邊界節點不存在情況，簡化編程難度，降低代碼複雜度。

LRU 算法實現代碼如下，為了簡化 key ，val 都認為 int 類型。

public class LRUCache { Entry head, tail; int capacity; int size; Map cache; public LRUCache(int capacity) { this.capacity = capacity; // 初始化鏈表 initLinkedList(); size = 0; cache = new HashMap<>(capacity + 2); } /** * 如果節點不存在，返回 -1.如果存在，將節點移動到頭結點，並返回節點的數據。 * * @param key * @return */ public int get(int key) { Entry node = cache.get(key); if (node == null) { return -1; } // 存在移動節點 moveToHead(node); return node.value; } /** * 將節點加入到頭結點，如果容量已滿，將會刪除尾結點 * * @param key * @param value */ public void put(int key, int value) { Entry node = cache.get(key); if (node != null) { node.value = value; moveToHead(node); return; } // 不存在。先加進去，再移除尾結點 // 此時容量已滿刪除尾結點 if (size == capacity) { Entry lastNode = tail.pre; deleteNode(lastNode); cache.remove(lastNode.key); size--; } // 加入頭結點 Entry newNode = new Entry(); newNode.key = key; newNode.value = value; addNode(newNode); cache.put(key, newNode); size++; } private void moveToHead(Entry node) { // 首先刪除原來節點的關係 deleteNode(node); addNode(node); } private void addNode(Entry node) { head.next.pre = node; node.next = head.next; node.pre = head; head.next = node; } private void deleteNode(Entry node) { node.pre.next = node.next; node.next.pre = node.pre; } public static class Entry { public Entry pre; public Entry next; public int key; public int value; public Entry(int key, int value) { this.key = key; this.value = value; } public Entry() { } } private void initLinkedList() { head = new Entry(); tail = new Entry(); head.next = tail; tail.pre = head; } public static void main(String[] args) { LRUCache cache = new LRUCache(2); cache.put(1, 1); cache.put(2, 2); System.out.println(cache.get(1)); cache.put(3, 3); System.out.println(cache.get(2)); } }

LRU 算法分析

緩存命中率是緩存系統的非常重要指標，如果緩存系統的緩存命中率過低，將會導致查詢迴流到數據庫，導致數據庫的壓力升高。

結合以上分析 LRU 算法優缺點。

LRU 算法優勢在於算法實現難度不大，對於對於熱點數據， LRU 效率會很好。

LRU 算法劣勢在於對於偶發的批量操作，比如說批量查詢歷史數據，就有可能使緩存中熱門數據被這些歷史數據替換，造成緩存汙染，導致緩存命中率下降，減慢了正常數據查詢。

LRU 算法改進方案

以下方案來源與 MySQL InnoDB LRU 改進算法

將鏈表拆分成兩部分，分為熱數據區，與冷數據區，如圖所示。

改進之後算法流程將會變成下面一樣:

訪問數據如果位於熱數據區，與之前 LRU 算法一樣，移動到熱數據區的頭結點。插入數據時，若緩存已滿，淘汰尾結點的數據。然後將數據插入冷數據區的頭結點。處於冷數據區的數據每次被訪問需要做如下判斷：若該數據已在緩存中超過指定時間，比如說 1 s，則移動到熱數據區的頭結點。若該數據存在在時間小於指定的時間，則位置保持不變。

對於偶發的批量查詢，數據僅僅只會落入冷數據區，然後很快就會被淘汰出去。熱門數據區的數據將不會受到影響，這樣就解決了 LRU 算法緩存命中率下降的問題。

其他改進方法還有 LRU-K，2Q,LIRS 算法，感興趣同學可以自行查閱。

本文由博客一文多發平臺 https://openwrite.cn?from=article_bottom 發佈！

這幾道 Redis 面試題都不懂，怎麼拿 Offer？

SSH問題整理

緩存在分佈式系統中的應用四層緩存架構學習（一）

20萬用戶同時訪問一個熱點Key，如何優化緩存架構？

IPC提升近百分之20！zen3架構銳龍5000處理器來了

AMD第二款支持PCI-E 4.0的芯片組公佈，一起來的還有2款新CPU

那天服務器內存被 Java 線程撐爆了，簡單的 JVM 問題診斷流程

魅族召開5G技術交流會；魅族17定妝照確定

視頻AI芯片-SV810，可替代海思hi3516dv300

通用的報表緩存設計（Spring AOP + Redis）非常全面！快看看吧！

128核心CPU問世：12通道DDR5＋PCIe5.0、性能超頂級Intel至強

每日一句 | “緩存”英文怎麼說？

前端知必會的緩存規則

AMD正式發佈Zen 3架構銳龍5000系列處理器

s、希捷酷玩520系PCIe4.0固態

系統架構設計師（八）——計算機組成與體系結構-緩存

系統架構設計師（九）——計算機組成與體系結構-緩存-地址映射1

系統架構設計師（十）——計算機組成與體系結構-緩存-地址映射2

Java高併發解決方案！漲薪必備

AMD發佈“全球單核性能最快”CPU，參數碾壓英特爾，性能提升47％

274元國產康佳NVME M2 500G固態硬盤走價格路線？

榮耀V30、小米10的5G網速對比來襲！前者遠超後者

Python的數據緩存機制探究

AMD 將推出 7nm R3 處理器：4核8線程，16MB三級緩存

沒想到SpringCache還可以這麼玩

AMD發佈“全球單核性能最快”CPU，參數碾壓英特爾，性能提升47%

小容量 iPhone 福音！為什麼我強烈建議你升級到 iOS 13.6.1

相關文章:

這幾道 Redis 面試題都不懂，怎麼拿 Offer？

SSH問題整理

緩存在分佈式系統中的應用四層緩存架構學習（一）

20萬用戶同時訪問一個熱點Key，如何優化緩存架構？

IPC提升近百分之20！zen3架構銳龍5000處理器來了

AMD第二款支持PCI-E 4.0的芯片組公佈，一起來的還有2款新CPU

那天服務器內存被 Java 線程撐爆了，簡單的 JVM 問題診斷流程

魅族召開5G技術交流會；魅族17定妝照確定

視頻AI芯片-SV810，可替代海思hi3516dv300

通用的報表緩存設計（Spring AOP + Redis）非常全面！快看看吧！

128核心CPU問世：12通道DDR5＋PCIe5.0、性能超頂級Intel至強

每日一句 | “緩存”英文怎麼說？

前端知必會的緩存規則

AMD正式發佈Zen 3架構銳龍5000系列處理器

s、希捷酷玩520系PCIe4.0固態

系統架構設計師（八）——計算機組成與體系結構-緩存

系統架構設計師（九）——計算機組成與體系結構-緩存-地址映射1

系統架構設計師（十）——計算機組成與體系結構-緩存-地址映射2

Java高併發解決方案！漲薪必備

AMD發佈“全球單核性能最快”CPU，參數碾壓英特爾，性能提升47％

274元國產康佳NVME M2 500G固態硬盤走價格路線？

榮耀V30、小米10的5G網速對比來襲！前者遠超後者

Python的數據緩存機制探究

AMD 將推出 7nm R3 處理器：4核8線程，16MB三級緩存

沒想到SpringCache還可以這麼玩

AMD發佈“全球單核性能最快”CPU，參數碾壓英特爾，性能提升47%

小容量 iPhone 福音！為什麼我強烈建議你升級到 iOS 13.6.1

手淘圖片庫新特性解析

利用下班時間，我兩星期完成了redis入門與進階

老生常談-如何建設高可用系統？

閉關三月：整理出了這份對標阿里p7的java春招面試必備指南。

「漲姿勢」手機內存64G都不夠用怎麼辦？這幾招就夠用了

高頻面試點：Android性能優化之內存優化（下篇）

哪些設置會使手機越來越卡？九種行為不要做，很多人沒注意

互聯網面試中躲不開的緩存問題

手把手詳細教你優化CSS提高網站加載速度的21種方法彙總【實踐】

微服務的幾種設計模式

我們程序員應該是工程師

Apache Druid —當代大數據分析的必要條件

2T硬盤也用上了這個“新技術” 到底是好事還是壞事

Windows裝機必備，這5個軟件讓電腦更清爽，提高你的工作效率

《Java併發進階系列》之volatile的實現原理與應用

AMD Ryzen處理器家族迎來新成員，支持PCI-E 4.0的B550也要來了

redis簡介

SpringBoot整合NoSQL 數據庫(Redis)實現緩存

程序員們遇到最難調試的bug是什麼？

堂堂紅盤混用SMR、PMR被網友抓包：西數承認了

如果你用華為手機，請及時調整這4個功能，不然手機越來越卡

手機存儲空間不夠用，幾招幫你解決手機存儲空間問題

windows10系統如何刷新DNS緩存

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

當我們在談 SaaS 的時候，在談什麼？

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

5月西安招聘會時間安排來了！找工作的別錯過

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

“幫助當地居民解決用水難題”-今日頭條-手機光明網

灌籃高手無水印壁紙，每一張都是回憶

通遼藍天救援隊成功解救遼河公園水上被困群眾

5月6日·武漢要聞及抗擊肺炎快報

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

相聲界的顏值擔當張雲雷稱號大揭祕

美國百年薅羊毛攻略

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患