面試上來就問的MySQL事務頭條網

面試上來就問的MySQL事務

2021-05-10 23:53:04 佚名

一、什麼是事務

事務是獨立的工作單元，在這個獨立工作單元中所有操作要麼全部成功，要麼全部失敗。

也就是說如果有任何一條語句因為崩潰或者其它原因導致執行失敗，那麼未執行的語句都不會再執行，已經執行的語句會進行回滾操作，這個過程被稱之為事務。

例：

最近在寫一個論壇系統，當發佈的主題被其它用戶舉報後，後臺會對舉報內容進行審核。

一經審核為違規主題，則進行刪除主題的操作，但不僅僅要刪除主題還要刪除主題下的帖子、瀏覽量，關於這個主題的一切信息都需要進行清理。

刪除流程如下，用上邊概念來說，以下執行的四個流程，每個流程都必須成功否則事務回滾返回刪除失敗。

假設執行到了第三步後SQL執行失敗了，那麼第一二步都會進行回滾，第四步則不會再執行。

二、事務四大特徵

事務的四大特徵，原子性、一致性、隔離性、持久性。

1. 原子性

事務中所有操作要麼全部成功，要麼全部失敗，不會存在一部分成功，一部分失敗。

這個概念也是事務最核心的特性，事務概念本身就是使用原子性進行定義的。

原子性的實現是基於回滾日誌實現（undo log），當事務需要回滾時就會調用回滾日誌進行SQL語句回滾操作，實現數據還原。

2. 一致性

一致性，字面意思就是前後一致唄！在數據庫中不管進行任何操作，都是從一個一致性轉移到另一個一致性。

當事務結束後，數據庫的完整性約束不被破壞。

當你瞭解完事務的四大特徵之後就會發現，都是保證數據一致性為最終目標存在的。

在學習事務的過程中大家看到最多的案例就是轉賬，假設用戶A與用戶B餘額共計1000，那麼不管怎麼轉倆人的餘額自始至終也就只有1000。

3. 隔離性

保證事務執行儘可能的不受其它事務影響，這個是隔離級別可以自行設置，在innodb中默認的隔離級別為可重複讀（Repeatable Read）。

這種隔離級別有可能造成的問題就是出現幻讀，但是使用間隙鎖可以解決幻讀問題。

學習了隔離性你需要知道原子性和持久性是針對單個事務，而隔離性是針對事務與事務之間的關係。

4. 持久性

持久性是指當事務提交之後，數據的狀態就是永久的，不會因為系統崩潰而丟失。

事務持久性是基於重做日誌（redo log）實現的。

三、事務併發會出現的問題

1. 髒讀

讀取了另一個事務沒有提交的數據。

事務A

事務B

執行事務

主題訪問量從100修改到150

查詢主題訪問量為150

提交事務

以上表為例，事務A讀取主題訪問量時讀取到了事務B沒有提交的數據150。

如果事務B失敗進行回滾，那麼修改後的值還是會回到100。

然而事務A獲取的數據是修改後的數據，這就有問題了。

2. 不可重複讀

事務讀取同一個數據，返回結果先後不一致問題。

事務A

事務B

執行事務

查詢主題訪問量為100

修改主題訪問量為200

提交事務

查詢主題訪問量為200

上表格中，事務A在先後獲取主題訪問量時，返回的數據不一致。

也就是說在事務A執行的過程中，訪問量被其它事務修改，那麼事務A查詢到的結果就是不可靠的。

**髒讀與不可重複讀的區別**

髒讀讀取的是另一個事務沒有提交的數據，而不可重複讀讀取的是另一個事務已經提交的數據。

3. 幻讀

事務按照範圍查詢，兩次返回結果不同。

事務A

事務B

開始事務

查詢訪問量100-200的主題個數為100

此時有一篇新的文章訪問量達到了150

提交事務

再次查詢訪問量100-200的主題個數為101

以上表為例，當對100-200訪問量的主題做統計時，第一次找到了100個，第二次找到了101個。

4. 區別

髒讀讀取的是另一個事務沒有提交的數據，而不可重複讀讀取的是另一個事務已經提交的數據。
幻讀和不可重複讀都是讀取了另一條已經提交的事務（這點與髒讀不同），所不同的是不可重複讀查詢的都是同一個數據項，而幻讀針對的是一批數據整體（比如數據的個數）。

針對以上的三個問題，產生了四種隔離級別。

在第二節中對隔離性進行了簡單的概念解釋，實際上的隔離性是很複雜的。

在MySQL中定義了四種隔離級別，分別為未提交讀（Read Uncommitted）、提交讀（Read committed）、可重複讀取（Repeatable Read）、可串行化（Serializable）。

未提交讀（Read Uncommitted）：倆個事務同時運行，有一個事務修改了數據，但未提交，另一個事務是可以讀取到沒有提交的數據。這種情況被稱之為
髒讀
。
提交讀（Read committed）：一個事務在未提交之前，所做的任何操作其它事務不可見。這種隔離級別也被稱之為
不可重複讀
。因為會存在兩次同樣的查詢，返回的數據可能會得到不一樣的結果。
可重複讀（Repeatable Read）：這種隔離級別
解決了髒讀
問題，但是還是
存在幻讀
問題，這種隔離界別在MySQL的innodb引擎中是默認級別。MySQL在解決幻讀問題使用間隙鎖來解決幻讀問題。
可串行化（Serializable）：這種級別是最高的，強制事務進行串行執行，解決了可重複讀的幻讀問題。

隔離級別

髒讀

不可重讀讀

幻讀

未提交讀（Read Uncommitted）

可能發生

提交讀（Read committed）

不可能發生

可能發生

可重複讀（Repeatable Read）

不可能發生

可能發生

可串行化（Serializable）

不可能發生

對於隔離級別，級別越高併發就越低，而級別越低會引發髒讀、不可重複讀、幻讀的問題。

因此在MySQL中使用可重複讀（Repeatable Read）作為默認級別。

作為默認級別是如何解決並處理相應問題的呢！

那麼針對這一問題，是一個難啃的骨頭，咔咔將在下一期MVCC文章專門來介紹這塊。

四、事務日誌以及事務異常如何應對

MySQL的版本號為8.0

在Innodb中事務的日誌分為兩種，回滾日誌、重做日誌。

先來看一下倆個日誌的存放位置吧！

在Linux下的MySQL事務日誌存放在/var/lib/mysql這個位置中。

從上圖中可以看到分別為ib_logfile、undo_倆個文件。

ib_logfile文件為重做日誌

undo_文件為回滾日誌

在這裡估計有點小夥伴會有點迷糊這個回滾日誌。

那是因為在MySQL5.6默認回滾日誌沒有進行獨立表空間存儲，而是存放到了ibdata文件中。

獨立表空間存儲從MySQL5.6後就已經支持了，但是需要自行配置。

在MySQL8.0是由innodb_undo_tablespaces 這個參數來設置回滾日誌獨立空間個數，這個參數的範圍為0-128。

默認值為0表示不開啟獨立的回滾日誌，且回滾日誌存儲在ibdata文件中。

這個參數是在初始化數據庫時指定的，實例一旦創建這個參數是不能改動的。

如果設置的innodb_undo_tablespaces 值大於實例創建時的個數，則會啟動失敗。

1. 重做日誌（redo log）（持久性實現原理）

事務的持久性就是通過重做日誌來實現的。

當提交事務之後，並不是直接修改數據庫的數據的，而是先保證將相關的操作記錄到redo日誌中。

數據庫會根據相應的機制將內存的中的髒頁數據刷新到磁盤中。

上圖是一個簡單的重做日誌寫入流程。

在上圖中提到倆個陌生概念，Buffer pool、redo log buffer，這個倆個都是Innodb存儲引擎的內存區域的一部分。

而redo log file是位於磁盤位置。

也就說當有DML（insert、update、delete）操作時，數據會先寫入Buffer pool，然後再寫到重做日誌緩衝區。

重做日誌緩衝區會根據刷盤機制來進行寫入重做日誌中。

這個機制的設置參數為innodb_flush_log_at_trx_commit ，參數分別為0,1，2

上圖即為重做日誌的寫入策略。

當這個參數的值為0的時，提交事務之後，會把數據存放到redo log buffer中，然後每秒將數據寫進磁盤文件
當這個參數的值為1的時，提交事務之後，就必須把redo log buffer從內存刷入到磁盤文件裡去，只要事務提交成功，那麼redo log就必然在磁盤裡了。
當這個參數的值為2的情況，提交事務之後，把redo log buffer日誌寫入磁盤文件對應的os cache緩存裡去，而不是直接進入磁盤文件，1秒後才會把os cache裡的數據寫入到磁盤文件裡去。

2. 服務器異常停止對事務如何應對（事務寫入過程）

當參數為0時，前一秒的日誌都保存在日誌緩衝區，也就是內存上，如果機器宕掉，可能丟失1秒的事務數據。
當參數為1時，數據庫對IO的要求就非常高了，如果底層的硬件提供的IOPS比較差，那麼MySQL數據庫的併發很快就會由於硬件IO的問題而無法提升。
當參數為2時，數據是直接寫進了os cache緩存，這部分屬於操作系統部分，如果操作系統部分損壞或者斷電的情況會丟失1秒內的事務數據，這種策略相對於第一種就安全了很多，並且對IO要求也沒有那麼高。

小結

關於性能：0>2>1

關於安全：1>2>0

根據以上結論，所以說在MySQL數據庫中，刷盤策略默認值為1，保證事務提交之後，數據絕對不會丟失。