10.08 深入理解SQL原理：一條SQL查詢語句是如何執行的？

2019-10-08 07:46:00 老男孩的成長之路

本篇文章將通過一條 SQL 的執行過程來介紹 MySQL 的基礎架構。

首先有一個 user_info 表，表裡有一個 id 字段，執行下面這條查詢語句：

select * from user_info where id = 1;

返回結果為：

+----+----------+----------+--------+------+---------------------+---------------------+
| id | username | password | openid | role | create_time | update_time |
+----+----------+----------+--------+------+---------------------+---------------------+
| 1 | 武培軒 | 123 | 1 | 1 | 2019-08-29 00:29:08 | 2019-08-29 00:29:08 |
+----+----------+----------+--------+------+---------------------+---------------------+

下面給出 MySQL 的基本架構示意圖，可以看出 SQL 語句在 MySQL 的各個模塊中的執行過程。

MySQL 基本架構

大體上，MySQL 分為 Server 層和存儲引擎層兩部分。

Server 層包括連接器、查詢緩存、分析器、執行器等，以及所有的內置函數（如日期、時間、數學和加密函數等）和跨存儲引擎的功能（如存儲過程、觸發器、視圖）。

存儲引擎層負責數據的存儲和提取，支持 InnoDB、MyISAM、Memory 等多個存儲引擎。MySQL 5.5.5 版本後默認存儲存儲引擎是 InnoDB。

1.連接器（Connector）

在查詢 SQL 語句前，肯定要先建立與 MySQL 的連接，這就是由連接器來完成的。連接器負責跟客戶端建立連接、獲取權限、維持和管理連接。連接命令為：

mysql -h$ip -P$port -u$user -p

輸入密碼，驗證通過後，連接器會到權限表裡面查出你擁有的權限，之後這個連接裡面的權限判斷邏輯，都將依賴於此時讀到的權限，一個用戶成功建立連接後，即使管理員對這個用戶的權限做了修改，也不會影響已經存在連接的權限，修改完後，只有再新建的連接才會使用新的權限設置。

連接完成後，如果你沒有後續的動作，這個連接就處於空閒狀態，你可以在 show processlist 命令中看到它。結果如下：

+----+------+----------------+------------------+---------+------+----------+------------------+
| Id | User | Host | db | Command | Time | State | Info |
+----+------+----------------+------------------+---------+------+----------+------------------+
| 3 | root | localhost:2790 | NULL | Sleep | 5878 | | NULL |
| 4 | root | localhost:2791 | springcloud_sell | Sleep | 5838 | | NULL |
| 7 | root | localhost:2900 | springcloud_sell | Sleep | 5838 | | NULL |
| 10 | root | localhost:3627 | springcloud_sell | Query | 0 | starting | show processlist |
+----+------+----------------+------------------+---------+------+----------+------------------+

客戶端如果太長時間沒動靜，連接器就會自動將它斷開；這個時間是由參數 wait_timeout 控制的，默認值是8小時。如果在連接被斷開之後，客戶端再次發送請求的話，就會收到一個錯誤提醒：Lost connection to MySQL server during query。

長連接和短連接

數據庫裡面，長連接是指連接成功後，如果客戶端持續有請求，則一直使用同一個連接。
短連接則是指每次執行完很少的幾次查詢就斷開連接，下次查詢再重新建立一個。

建立連接的過程通常是比較複雜的，建議在使用中要儘量減少建立連接的動作，儘量使用長連接。但是全部使用長連接後，有時候 MySQL 佔用內存漲得特別快，這是因為 MySQL 在執行過程中臨時使用的內存是管理在連接對象裡面的。這些資源會在連接斷

開的時候才釋放。所以如果長連接累積下來，可能導致內存佔用太大，被系統強行殺掉（OOM），從現象看就是 MySQL 異常重啟了。

怎麼解決這個問題呢？可以考慮以下兩種方案：

定期斷開長連接。使用一段時間，或者程序裡面判斷執行過一個佔用內存的大查詢後，斷開連接，之後要查詢再重連。
MySQL 5.7 以上版本，可以在每次執行一個比較大的操作後，通過執行 mysql_reset_connection 來重新初始化連接資源。這個過程不需要重連和重新做權限驗證，但是會將連接恢復到剛剛創建完時的狀態。

2.查詢緩存（Query Cache）

在建立連接後，就開始執行 select 語句了，執行前首先會查詢緩存。

MySQL 拿到查詢請求後，會先查詢緩存，看是不是執行過這條語句。執行過的語句及其結果會以 key-value 對的形式保存在一定的內存區域中。key 是查詢的語句，value 是查詢的結果。如果你的查詢能夠直接在這個緩存中找到 key，那麼這個

value 就會被直接返回給客戶端。

如果語句不在查詢緩存中，就會繼續後面的執行階段。執行完成後，執行結果會被存入查詢緩存中。如果查詢命中緩存，MySQL 不需要執行後面的複雜操作，就可以直接返回結果，會提升效率。

但是查詢緩存的失效非常頻繁，只要有對一個表的更新，這個表上所有的查詢緩存都會被清空。對於更新壓力大的數據庫來說，查詢緩存的命中率會非常低。如果業務中需要有一張靜態表，很長時間才會更新一次。比如，一個系統配置表，那這張表上的查詢才適合使用查詢緩存。MySQL 提供了這種按需使用的方式。可以將參數 query_cache_type 設置成 DEMAND，對於默認的 SQL 語句都將不使用查詢緩存。而對於你確定要使用查詢緩存的語句，可以用 SQL_CACHE 顯式指定，如下：

mysql> select SQL_CACHE * from user_info where id = 1;

MySQL 8.0 版本將查詢緩存的功能刪除了。

3.分析器（Analyzer）

如果查詢緩存未命中，就要開始執行語句了。首先，MySQL 需要對 SQL 語句進行解析。

分析器先會做詞法分析。SQL 語句是由多個字符串和空格組成的，MySQL 需要識別出裡面的字符串分別是什麼，代表什麼。MySQL 從你輸入的 select 這個關鍵字識別出來，這是查詢語句。它也要把字符串 user_info 識別成表名，把字符串 id 識別成列名。之後就要做語法分析。根據詞法分析的結果，語法分析器會根據語法規則，判斷輸入的 SQL 語句是否滿足 MySQL 語法。

如果你 SQL 語句不對，就會收到 You have an error in your SQL syntax 的錯誤提醒，比如下面這個語句 from 寫成了 form。

mysql> select * form user_info where id = 1;
1064 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'form user_info where id = 1' at line 1

一般語法錯誤會提示第一個出現錯誤的位置，所以要關注的是緊接 use near 的內容。

4.優化器（Optimizer）

經過分析器的詞法分析和語法分析後，還要經過優化器的處理。

優化器是在表裡面有多個索引的時候，決定使用哪個索引；或者在一個語句有多表關聯（join）的時候，決定各個表的連接順序。比如你執行下面這樣的語句，這個語句是執行兩個表的 join：

mysql> SELECT * FROM order_master JOIN order_detail USING (order_id) WHERE order_master.pay_status = 0 AND order_detail.detail_id = 1558963262141624521;

既可以先從表 order_master 裡面取出 pay_status = 0 的記錄的 order_id 值，再根據 order_id 值關聯到表 order_detail，再判斷 order_detail 裡面 detail_id 的值是否等於 1558963262141624521。

也可以先從表 order_detail 裡面取出 detail_id = 1558963262141624521 的記錄的 order_id 值，再根據 order_id 值關聯到 order_master，再判斷 order_master 裡面 pay_status 的值是否等於 0。

這兩種執行方法的邏輯結果是一樣的，但是執行的效率會有不同，而優化器的作用就是決定選擇使用哪一個方案。優化器階段完成後，這個語句的執行方案就確定下來了，然後進入執行器階段。

5.執行器（Actuator）

MySQL 通過分析器知道了要做什麼，通過優化器知道了該怎麼做，於是就進入了執行器階段，開始執行語句。

開始執行的時候，要先判斷一下你對這個表 user_info 有沒有執行查詢的權限，如果沒有，就會返回沒有權限的錯誤，如下所示 (如果命中查詢緩存，會在查詢緩存返回結果的時候，做權限驗證。查詢也會在優化器之前調用 precheck 驗證權限)。

mysql> select * from user_info where id = 1;
ERROR 1142 (42000): SELECT command denied to user 'wupx'@'localhost' for table 'user_info'

如果有權限，就打開表繼續執行。打開表的時候，執行器就會根據表的引擎定義，去使用這個引擎提供的接口。比如我們這個例子中的表 user_info 中，id 字段沒有索引，那麼執行器的執行流程是這樣的：

調用 InnoDB 引擎接口取這個表的第一行，判斷 id 值是不是 1，如果不是則跳過，如果是則將這行存在結果集中；
調用引擎接口取下一行，重複相同的判斷邏輯，直到取到這個表的最後一行。
執行器將上述遍歷過程中所有滿足條件的行組成的記錄集作為結果集返回給客戶端。

對於有索引的表，第一次調用的是取滿足條件的第一行這個接口，之後循環取滿足條件的下一行這個接口。

數據庫的慢查詢日誌中有 rows_examined 字段，表示這個語句執行過程中掃描了多少行。這個值就是在執行器每次調用引擎獲取數據行的時候累加的。在有些場景下，執行器調用一次，在引擎內部則掃描了多行，因此引擎掃描行數跟 rows_examined 並不是完全相同的。

總結

主要通過對一個 SQL 語句完整執行過程進行講解，介紹 MySQL 的邏輯架構，MySQL 主要包括連接器、查詢緩存、分析器、優化器、執行器這幾個模塊。

點關注，不迷路！

分享到:

閱讀更多 老男孩的成長之路 的文章

關鍵字: 一條 SQL 語句

shell-case語句

shell-if語句

shell條件判斷

Truncate用法詳解

C#入門之變量類型

JavaScript If...Else 語句

SELECT COUNT 語句，你真的瞭解它嗎？

JavaScript 語句

Oracle 分區表的 FOR 語句，你這樣用過嗎？

select * from user 這條 SQL 語句，背後藏著哪些不可告人的祕密

C++學習大綱：異常處理機制示例及講解

優化OR條件

01.15 一些 MySQL DBA 實用 SQL 語句

01.02 select * from user 這條 SQL 語句，藏著哪些不可告人的祕密？

mybatis-plus/mybatis 自定義 sql 語句、動態 sql

12.27 mybatis-plus/mybatis 自定義 sql 語句、動態 sql

解鎖新姿勢：探討複雜的 if-else 語句“優雅處理”的思路

C#判斷語句詳解(if、if-else、switch-case、三目/元運算符)

C++｜函數指針做參數，讓函數更一般化（選擇排序：升序或降序）

ORACLE多表關聯UPDATE 語句

自然語言到 SQL 語句，微軟只用六個子任務，結果超越人類水平

golang for 語句的特點和 range子句的關係

火熱公測！華為雲 DAS 支持一鍵診斷劣質 SQL 語句

VBA語法02：VBA語句之select判斷語句使用

VBA語法01：VBA當中的IF語句單一條件判斷和多條件判斷的使用

《碼出高效》——MYSQL資料庫SQL 語句

09.11 你試過不用if擼代碼嗎？

hibernate的三種檢索策略——今天比較下它們的優缺點

一文讀懂 with……as 語句

一些滲透和手工注入技巧

SQL GROUP BY 語句，送給正在迷茫的你

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"