索引是存儲引擎用於快速查找記錄的一種數據結構,通過合理的使用數據庫索引可以大大提高系統的訪問性能。那麼如何創建出更加合理且高效的索引呢?下面看我一一道來。
注:這裡主要針對的是 InnoDB 存儲引擎的 B+Tree 索引數據結構
一、使用索引的優點
大大減輕了服務器需要掃描的數據量,從而提高了數據的檢索速度
幫助服務器避免排序和臨時表
可以將隨機 I/O 變為順序 I/O
二、索引種類
Mysql索引分為:
普通索引
-
主鍵索引
唯一索引
全文索引
組合索引
三、創建索引
創建普通索引
ALTER TABLE'table_name' ADD INDEX'index_name' ('column');
創建主鍵索引
ALTER TABLE'table_name' ADD PRIMARY KEY'index_name' ('column');
創建唯一索引
ALTER TABLE'table_name' ADD UNIQUE 'index_name' ('column');
創建全文索引
ALTER TABLE 'table_name' ADD FULLTEXT 'index_name' ('column');
創建聚合索引
ALTER TABLE 'table_name' ADD INDEX 'index_name' ('column1', 'column2', ...);
四、高效索引的設計原則
1、索引列不能是表達式的一部分,也不能作為函數的參數,否則無法使用索引查詢。如下:
SELECT * FROM user_test WHERE user_name = concat(user_name, 'fei');
2、使用前綴索引
有時候需要索引很長的字符列,這會增加索引的存儲空間以及降低索引的效率,一種策略是可以使用哈希索引,還有一種就是可以使用前綴索引。前綴索引是選擇字符列的前n個字符作為索引,這樣可以大大節約索引空間,從而提高索引效率。
前綴索引要選擇足夠長的前綴以保證高的選擇性,同時又不能太長。我們可以通過以下方式來計算出合適的前綴索引的選擇長度值:
注:通過以上方式來計算出前綴索引的選擇性比值,比值越高說明索引的效率也就越高效。
注:通過以上語句逐步找到最接近於(1)中的前綴索引的選擇性比值,那麼就可以使用對應的字符截取長度來做前綴索引了
創建前綴索引,可以按如下操作:
ALTER TABLE table_name ADD INDEX index_name (index_column(length));
說明:前綴索引是一種能使索引更小,更快的有效辦法,但是MySql無法使用前綴索引做ORDER BY 和 GROUP BY以及使用前綴索引做覆蓋掃描。
3、選擇合適的索引列順序
在組合索引的創建中索引列的順序非常重要,正確的索引順序依賴於使用該索引的查詢方式。
對於組合索引的索引順序可以通過經驗法則來幫助我們完成:將選擇性最高的列放到索引最前列,該法則與前綴索引的選擇性方法一致,但並不是說所有的組合索引的順序都使用該法則就能確定,還需要根據具體的查詢場景來確定具體的索引順序。
4、聚集索引與非聚集索引
聚集索引
聚集索引決定數據在物理磁盤上的物理排序,一個表只能有一個聚集索引,如果定義了主鍵,那麼 InnoDB 會通過主鍵來聚集數據,如果沒有定義主鍵,InnoDB 會選擇一個唯一的非空索引代替,如果沒有唯一的非空索引,InnoDB 會隱式定義一個主鍵來作為聚集索引。
聚集索引可以很大程度的提高訪問速度,因為聚集索引將索引和行數據保存在了同一個 B-Tree 中,所以找到了索引也就相應的找到了對應的行數據,但在使用聚集索引的時候需注意避免隨機的聚集索引(一般指主鍵值不連續,且分佈範圍不均勻)。
如使用 UUID 來作為聚集索引性能會很差,因為 UUID 值的不連續會導致增加很多的索引碎片和隨機I/O,最終導致查詢的性能急劇下降。
非聚集索引
與聚集索引不同的是非聚集索引並不決定數據在磁盤上的物理排序,且在 B-Tree 中包含索引但不包含行數據,行數據只是通過保存在 B-Tree 中的索引對應的指針來指向行數據,如:上面在(user_name,city, age)上建立的索引就是非聚集索引。
5、覆蓋索引
如果一個索引(如:組合索引)中包含所有要查詢的字段的值,那麼就稱之為覆蓋索引,如:
SELECT user_name, city, age FROM user_test WHERE user_name ='feinik' AND age > 25;
因為要查詢的字段(user_name, city, age)都包含在組合索引的索引列中,所以就使用了覆蓋索引查詢,查看是否使用了覆蓋索引可以通過執行計劃中的Extra中的值為Using index則證明使用了覆蓋索引,覆蓋索引可以極大的提高訪問性能。
6、如何使用索引來排序
在排序操作中如果能使用到索引來排序,那麼可以極大的提高排序的速度,要使用索引來排序需要滿足以下兩點即可。
ORDER BY 子句後的列順序要與組合索引的列順序一致,且所有排序列的排序方向(正序/倒序)需一致;
所查詢的字段值需要包含在索引列中,及滿足覆蓋索引。
通過例子來具體分析,如下創建一個組合索引:
ALTER TABLE user_test ADD INDEX index_user(user_name , city , age);
可以使用到索引排序的案例:
注:第4點比較特殊一點,如果where查詢條件為索引列的第一列,且為常量條件,那麼也可以使用到索引
無法使用索引排序的案例:
1、sex不在索引列中
2、 排序列的方向不一致
3、所要查詢的字段列sex沒有包含在索引列中
4、 where查詢條件後的user_name為範圍查詢,所以無法使用到索引的其他列
5、多表連接查詢時,只有當ORDER BY後的排序字段都是第一個表中的索引列(需要滿足以上索引排序的兩個規則)時,方可使用索引排序。如:
再創建一個用戶的擴展表user_test_ext,並建立uid的索引。
走索引排序:
不走索引排序:
關注“編碼之道”,及時查看最新內容……
閱讀更多 編碼之道 的文章