從入門到熟悉，一步一步帶你瞭解 MySQL 中的「索引」和「鎖」

2019-10-28 20:55:00 Java高級架構師阿谷

索引

索引常見的幾種類型

索引常見的類型有哈希索引，有序數組索引，二叉樹索引，跳錶等等。本文主要探討 MySQL 的默認存儲引擎 InnoDB 的索引結構。

InnoDB的索引結構

在InnoDB中是通過一種多路搜索樹——B+樹實現索引結構的。在B+樹中是只有葉子結點會存儲數據，而且所有葉子結點會形成一個鏈表。而在InnoDB中維護的是一個雙向鏈表。

你可能會有一個疑問，為什麼使用 B+樹而不使用二叉樹或者B樹？

首先，我們知道訪問磁盤需要訪問到指定塊中，而訪問指定塊是需要 盤片旋轉 和 磁臂移動 的，這是一個比較耗時的過程，如果增加樹高那麼就意味著你需要進行更多次的磁盤訪問，所以會採用n叉樹。而使用B+樹是因為如果使用B樹在進行一個範圍查找的時候每次都會進行重新檢索，而在B+樹中可以充分利用葉子結點的鏈表。

在建表的時候你可能會添加多個索引，而 InnDB 會為每個索引建立一個 B+樹進行存儲索引。

比如這個時候我們建立了一個簡單的測試表

create table test(
 id int primary key,
 a int not null,
 name varchar,
 index(a)
)engine = InnoDB;

這個時候 InnDB 就會為我們建立兩個 B+索引樹

一個是主鍵的 聚簇索引，另一個是 普通索引 的 輔助索引，這裡我直接貼上 MySQL淺談（索引、鎖）這篇文章上面的貼圖(因為我懶不想畫圖了。。。)

可以看到在輔助索引上面的葉子節點的值只是存了主鍵的值，而在主鍵的聚簇索引上的葉子節點才是存上了整條記錄的值。

回表

所以這裡就會引申出一個概念叫回表，比如這個時候我們進行一個查詢操作

select name from test where a = 30;

我們知道因為條件 MySQL 是會走 a 的索引的，但是 a 索引上並沒有存儲 name 的值，此時我們就需要拿到相應 a 上的主鍵值，然後通過這個主鍵值去走 聚簇索引 最終拿到其中的name值，這個過程就叫回表。

我們來總結一下回表是什麼？MySQL在輔助索引上找到對應的主鍵值並通過主鍵值在聚簇索引上查找所要的數據就叫回表。

索引維護

我們知道索引是需要佔用空間的，索引雖能提升我們的查詢速度但是也是不能濫用。

比如我們在用戶表裡用身份證號做主鍵，那麼每個二級索引的葉子節點佔用約20個字節，而如果用整型做主鍵，則只要4個字節，如果是長整型（bigint）則是8個字節。也就是說如果我用整型後面維護了4個g的索引列表，那麼用身份證將會是20個g。

所以我們可以通過縮減索引的大小來減少索引所佔空間。

當然B+樹為了維護索引的有序性會在刪除，插入的時候進行一些必要的維護(在InnoDB中刪除會將節點標記為“可複用”以減少對結構的變動)。

比如在增加一個節點的時候可能會遇到數據頁滿了的情況，這個時候就需要做頁的分裂，這是一個比較耗時的工作，而且頁的分裂還會導致數據頁的利用率變低，比如原來存放三個數據的數據頁再次添加一個數據的時候需要做頁分裂，這個時候就會將現有的四個數據分配到兩個數據頁中，這樣就減少了數據頁利用率。

覆蓋索引

上面提到了回表，而有時候我們查輔助索引的時候就已經滿足了我們需要查的數據，這個時候 InnoDB 就會進行一個叫覆蓋索引的操作來提升效率，減少回表。

比如這個時候我們進行一個 select 操作

select id from test where a = 1;

這個時候很明顯我們走了 a 的索引直接能獲取到 id 的值，這個時候就不需要進行回表，我們這個時候就使用了 覆蓋索引。

簡單來說 覆蓋索引 就是當我們走輔助索引的時候能獲取到我們所需要的數據的時候不需要再次進行回表操作的操作。

聯合索引

這個時候我們新建一個學生表

CREATE TABLE `stu` (
 `id` int(11) NOT NULL, 

 `class` int(11) DEFAULT NULL,
 `name` varchar(255) DEFAULT NULL,
 PRIMARY KEY (`id`),
 KEY `class_name` (`class`,`name`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8

我們使用 class(班級號) 和 name 做一個 聯合索引，你可能會問這個聯合索引有什麼用呢？我們可以結合著上面的 覆蓋索引 去理解，比如這個時候我們有一個需求，我們需要通過班級號去找對應的學生姓名 。

select name from stu where class = 102;

這個時候我們就可以直接在 輔助索引 上查找到學生姓名而不需要再次回表。

總的來說，設計好索引，充分利用覆蓋索引能很大提升檢索速度。

最左前綴原則

這個是以 聯合索引 作為基礎的，是一種聯合索引的匹配規則。

這個時候，我們將上面的需求稍微變動一下，這時我們有個學生遲到，但是他在門衛記錄信息的時候只寫了自己的名字張三而沒有寫班級，所以我們需要通過學生姓名去查找相應的班級號。

select class from stu where name = '張三';

這個時候我們就不會走我們的聯合索引了，而是進行了全表掃描。

為什麼？因為 最左匹配原則。我們可以畫一張簡單的圖來理解一下。

我們可以看到整個索引設計就是這麼設計的，所以我們需要查找的時候也需要遵循著這個規則，如果我們直接使用name，那麼InnoDB是不知道我們需要幹什麼的。當然最左匹配原則還有這些規則

全值匹配的時候優化器會改變順序，也就是說你全值匹配時的順序和原先的聯合索引順序不一致沒有關係，優化器會幫你調好。
索引匹配從最左邊的地方開始，如果沒有則會進行全表掃描，比如你設計了一個(a,b,c)的聯合索引，然後你可以使用(a),(a,b),(a,b,c) 而你使用 (b),(b,c),(c)就用不到索引了。
遇到範圍匹配會取消索引。比如這個時候你進行一個這樣的 select 操作

select * from stu where class > 100 and name = '張三';

這個時候 InnoDB 就會放棄索引而進行全表掃描，因為這個時候 InnoDB 會不知道怎麼進行遍歷索引，所以進行全表掃描。

索引下推

我給你挖了個坑。剛剛的操作在 MySQL5.6 版本以前是需要進行回表的，但是5.6之後的版本做了一個叫 索引下推 的優化。

select * from stu where class > 100 and name = '張三';

如何優化的呢？因為剛剛的最左匹配原則我們放棄了索引，後面我們緊接著會通過回表進行判斷 name，這個時候我們所要做的操作應該是這樣的

但是有了索引下推之後就變成這樣了，此時 "李四" 和 "小明" 這兩個不會再進行回表。

因為這裡匹配了後面的name = 張三，也就是說，如果最左匹配原則因為範圍查詢終止了，InnoDB還是會索引下推來優化性能。

一些最佳實踐

哪些情況需要創建索引？

頻繁作為查詢條件的字段應創建索引。
多表關聯查詢的時候，關聯字段應該創建索引。
查詢中的排序字段，應該創建索引。
統計或者分組字段需要創建索引。

哪些情況不需要創建索引？

表記錄少。
經常增刪改查的表。
頻繁更新的字段。
where 條件使用不高的字段。
字段很大的時候。

其他

儘量選擇區分度高的列作為索引。
不要對索引進行一些函數操作，還應注意隱式的類型轉換和字符編碼轉換。
儘可能的擴展索引，不要新建立索引。比如表中已經有了a的索引，現在要加（a,b）的索引，那麼只需要修改原來的索引即可。
多考慮覆蓋索引，索引下推，最左匹配。

鎖

全局鎖

MySQL提供了一個加全局讀鎖的方法，命令是 Flush tables with read lock (FTWRL)。當你需要讓整個庫處於只讀狀態的時候，可以使用這個命令，之後其他線程的以下語句會被阻塞：數據更新語句（數據的增刪改）、數據定義語句（包括建表、修改表結構等）和更新類事務的提交語句。

一般會在進行 全庫邏輯備份 的時候使用，這樣就能確保 其他線程不能對該數據庫做更新操作。

在 MVCC 中提供了獲取 一致性視圖 的操作使得備份變得非常簡單，如果想了解 MVCC 可以參考我的另一篇文章你真的懂MVCC嗎？來手動實踐一下？。

表鎖

MDL(Meta Data Lock)元數據鎖

MDL鎖用來保證只有一個線程能對該表進行表結構更改。

怎麼說呢？MDL分為 MDL寫鎖 和 MDL讀鎖，加鎖規則是這樣的

當線程對一個表進行 CRUD 操作的時候會加 MDL讀鎖
當線程對一個表進行表結構更改操作的時候會加 MDL寫鎖
寫鎖和讀鎖，寫鎖和寫鎖互斥，讀鎖之間不互斥

lock tables xxx read/write;

這是給一個表設置讀鎖和寫鎖的命令，如果在某個線程A中執行lock tables t1 read, t2 write; 這個語句，則其他線程寫t1、讀寫t2的語句都會被阻塞。同時，線程A在執行unlock tables之前，也只能執行讀t1、讀寫t2的操作。連寫t1都不允許，自然也不能訪問其他表。

這種表鎖是一種處理併發的方式，但是在InnoDB中常用的是

行鎖。

行鎖

我們知道在5.5版本以前 MySQL 的默認存儲引擎是 MyISAM，而 MyISAM 和 InnoDB 最大的區別就是兩個

事務
行鎖

其中行鎖是我們今天的主題，如果不瞭解事務可以去補習一下。

其實行鎖就是兩個鎖，你可以理解為寫鎖(排他鎖 X鎖)和讀鎖(共享鎖 S鎖)

共享鎖（S鎖）：允許一個事務去讀一行，阻止其他事務獲得相同數據集的排他鎖。也叫做讀鎖：讀鎖是共享的，多個客戶可以同時讀取同一個資源，但不允許其他客戶修改。
排他鎖（X鎖)：允許獲得排他鎖的事務更新數據，阻止其他事務取得相同數據集的共享讀鎖和排他寫鎖。也叫做寫鎖：寫鎖是排他的，寫鎖會阻塞其他的寫鎖和讀鎖。

而行鎖還會引起一個一個很頭疼的問題，那就是死鎖。

如果事務A對行100加了寫鎖，事務B對行101加了寫鎖，此時事務A想要修改行101而事務B又想修改行100，這樣佔有且等待就導致了死鎖問題，而面對死鎖問題就只有檢測和預防了。

next-key鎖

MVCC 和行鎖是無法解決幻讀問題的，這個時候 InnoDB 使用了一個叫 GAP鎖(間隙鎖) 的東西，它配合行鎖形成了 next-key鎖，解決了幻讀的問題。

但是因為它的加鎖規則，又導致了擴大了一些加鎖範圍從而減少數據庫併發能力。具體的加鎖規則如下：

加鎖的基本單位是next-key lock 就是行鎖和GAP鎖結合。
查找過程中訪問到的對象就會加鎖。
索引上的等值查詢，給唯一索引加鎖的時候，next-key lock退化為行鎖。
索引上的等值查詢，向右遍歷時且最後一個值不滿足等值條件的時候，next-key lock退化為間隙鎖。
唯一索引上的範圍查詢會訪問到不滿足條件的第一個值為止。

MVCC 解決幻讀的思路比較複雜，這裡就不做過多的驗證。

總結

對於 MySQL 的索引來說，我給了很多最佳實踐，其實這些最佳實踐都是從原理來的，而 InnoDB 其實就是一個改進版的 B+樹，還有存儲索引的結構。弄懂了這些你就會得心應手起來。

而對於 MySQL 的鎖，主要就是在行鎖方面，InnoDB 其實就是使用了行鎖，MVCC還有next-key鎖來實現事務併發控制的。

而對於MySQL中最重要的其實就是鎖和索引了，因為內容太多這篇文章僅僅做一些介紹和簡單的分析，如果想深入瞭解可以查看相應的文章。

鏈接：https://juejin.im/post/5db19103e51d452a300b14c9

分享到:

閱讀更多 Java高級架構師阿谷 的文章

關鍵字: 阿里 Redis MySQL

在CentOS 上調試 MySQL-5.7.x 或者 MySQL-8.0 源碼

Mysql -樂觀鎖和悲觀鎖

MYSQL 利用 MYSQL Shell 安裝 INNODB Cluster 這坑踩得

電力企業信息管理系統(ssm,mysql)

MySQL 數據操作 DML

Mysql 查詢天、周，月，季度、年的數據

乾貨!MYSQL:事務管理，鎖機制案例詳解

MySQL 聚集索引和二級索引

專治 MySQL 亂碼，再也不想看到亂碼了

MySQL 派生表優化

03.03 MySQL 派生表優化

02.27 MySQL charset不同導致無法使用索引的坑

MySQL 8.0新特性：持久化自增列

mysql 建立索引的一個規則

使用 TCP Wrappers 保護 MySQL 如何導致服務中斷

mysql 索引的使用與優化看這篇就夠了

MySQL 的 B+Tree 索引樹到底該怎麼畫？

mysql 數據庫整理

MySQL 用 limit 會影響性能嗎？

MySQL-mdl鎖

關於 mysql 在開發過程中使用的點

MySQL C API 參數 MYSQL

MySQL explain詳解

MySQL 優化之EXPLAIN詳解(執行計劃)

MySQL 用 limit 為什麼會影響性能？

MySQL InnoDB的4個特性

MySQL：你知道什麼是覆蓋索引嗎？

MySql Binlog事件介紹篇

MySQL

mysql 中的數據類型

MySQL InnoDB引擎鎖的總結

MySQL 事務

「mysql」索引的設計和使用

MySQL：優化嵌套查詢和分頁查詢

「MySQL」mysql中語句執行的順序以及查詢處理階段的分析

mysql sql語句大全

MySQL 性能調優技巧

MySQL 常用30種SQL查詢語句優化方法

07.26 MySQL 高效分頁方案

MySQL query rewrite插件簡單測試

MySQL 從零開始：02 MySQL 安裝

07.07 MySQL——如何快速對比數據？

不像 MySQL 的 MySQL：MySQL 文檔存儲介紹

「MySQL」關於MySQL中的if和case語句的使用

MySQL-海量數量下的查詢效率提升

「mysql」詳解在查詢時，offset過大影響性能的原因與優化方法

MySQL EXPLAIN詳解

12.13 MySQL EXPLAIN詳解

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"