圖解快速排序及雙路三路快速排序

2020-02-11 20:18:57 放開我我還能學

前言

之前我們介紹了交換類排序中的冒泡排序，這次我們介紹另一種交換類排序叫做快速排序。快速排序的優點是原地排序，不佔用額外空間，時間複雜度是O(nlogn)。

當然，對於快速排序來說，它也是有缺點的，它對於含有大量重複元素的數組排序效率是非常低的，時間複雜度會降為O(n^2)。此時需要使用改進的快速排序—雙路快速排序，在雙路快速排序的基礎上，我們又進一步優化得到了三路快速排序。

快速排序

快速排序的基本思想是：通過一趟排序將要排序的數據分割成獨立的兩部分，其中一部分的所有數據都比另外一部分的所有數據都要小，然後再按此方法對這兩部分數據分別進行快速排序，整個排序過程可以遞歸進行，以此達到整個數據變成有序序列。

快速排序的步驟如下：

把第一個元素作為分界的標定點，用l指向它。
遍歷右邊元素，在遍歷的過程中，我們整理數組，一部分小於v，一部分大於v，用j指向小於v和大於v的分界點，用i指向當前訪問的元素e，此時，數組arr[l+1...j]v。
若e>v，那麼直接將e合併在大於v那麼部分的後面，然後i++繼續比較後面的元素。
若e
使用這種方式對整個數組進行一次遍歷，遍歷完後數組被分成三部分，左邊部分是v，中間部分是>v，右邊部分是
最後，我們讓l指向的元素和j指向的元素交換，這樣就v這個元素進行了快速排序，v左邊元素都小於v，右邊元素都大於v。

現在我們使用上述方法對數組[2, 1, 4, 3, 7, 8, 5, 6]進行快速排序，下圖展示了整個快速排序的過程：

快速排序代碼：

<code>public static void sort(Comparable[] arr) {  int n = arr.length;  sort(arr, 0, n - 1);}// 遞歸使用快速排序,對arr[l...r]的範圍進行排序private static void sort(Comparable[] arr, int l, int r) {  if (l >= r) {    return;   }  // 對arr[l...r]部分進行partition操作, 返回p, 使得arr[l...p-1] < arr[p] ; arr[p+1...r] > arr[p]  int p = partition(arr, l, r);  sort(arr, l, p - 1);  sort(arr, p + 1, r);}private static int partition(Comparable[] arr, int l, int r) {  // 最左元素作為標定點  Comparable v = arr[l];  int j = l;  for (int i = l + 1; i <= r; i++) {    if (arr[i].compareTo(v) < 0) {      swap(arr, j + 1, i);      j++;     }   }  swap(arr, l, j);  return j;}/<code>

優化的快速排序

經過上述介紹，我們可以發現快速排序不能保證每次切分的子數組大小相等，因此就可能一邊很小，一邊很大。對於一個有序數組，快速排序的時間複雜度就變成了O(n^2)，相當於樹退化成了鏈表，下圖展示了這種變化：

上述我們是固定使用左邊的第一個元素作為標定元素，現在我們隨機挑選一個元素作為標定元素。此時我們第一次選中第一個元素的概率為 1/n，第二次又選中第二個元素 1/n-1，以此類推，發生之前退化成鏈表的概率為1/n(n-1)(n-2)....，當 n 很大時，這種概率幾乎為 0。

另一個優化就是對小規模數組使用插入排序，因為遞歸會使得小規模問題中方法的調用過於頻繁，而插入排序對小規模數組排序是非常快的。

優化的快速排序代碼：

<code>public static void sort(Comparable[] arr) {  int n = arr.length;  sort(arr, 0, n - 1);}// 遞歸使用快速排序,對arr[l...r]的範圍進行排序private static void sort(Comparable[] arr, int l, int r) {  // 對於小規模數組, 使用插入排序  if (r - l <= 15) {    InsertionSort.sort(arr, l, r);    return;   }  // 對arr[l...r]部分進行partition操作, 返回p, 使得arr[l...p-1] < arr[p] ; arr[p+1...r] > arr[p]  int p = partition(arr, l, r);  sort(arr, l, p - 1);  sort(arr, p + 1, r);}private static int partition(Comparable[] arr, int l, int r) {  // 隨機在arr[l...r]的範圍中, 選擇一個數值作為標定點pivot  swap(arr, l, (int) (Math.random() * (r - l + 1)) + l);  Comparable v = arr[l];  int j = l;  for (int i = l + 1; i <= r; i++) {    if (arr[i].compareTo(v) < 0) {      swap(arr, j + 1, i);      j++;     }   }  swap(arr, l, j);  return j;}/<code>

雙路快速排序

對於含有大量重複元素的數組，使用上述的快速排序效率是非常低的，因為在我們上面的判斷中，如果元素小於v，則將元素放在v部分。此時，如果數組中有大量重複元素，>v部分會變得很長，導致左右兩邊不均衡，性能降低。

雙路快速排序的步驟如下：

將v兩部分放在數組的兩端，用i指向v部分的前一個元素。
從i開始向後遍歷，如果遍歷的元素e=v，則停止遍歷。同樣從j開始向前遍歷，如果遍歷的元素e>v，則繼續向前遍歷，直到遍歷的元素e<=v，則停止遍歷。
交換i指向的元素和j指向的元素。然後i++，j--繼續比較下一個。

雙路快速排序的代碼：

<code>public static void sort(Comparable[] arr) {  int n = arr.length;  sort(arr, 0, n - 1);}private static void sort(Comparable[] arr, int l, int r) {  // 對於小規模數組, 使用插入排序  if (r - l <= 15) {    InsertionSort.sort(arr, l, r);    return;   }  int p = partition(arr, l, r);  sort(arr, l, p - 1);  sort(arr, p + 1, r);}private static int partition(Comparable[] arr, int l, int r) {  // 隨機在arr[l...r]的範圍中, 選擇一個數值作為標定點pivot  swap(arr, l, (int) (Math.random() * (r - l + 1)) + l);  Comparable v = arr[l];  int i = l + 1, j = r;  while (true) {    // 注意這裡的邊界, arr[i].compareTo(v) < 0, 不能是arr[i].compareTo(v) <= 0    // 不加等號如果遇到相等的情況，這時候while循環就會退出，即交換i和j的值，使得對於包含大量相同元素的數組， 雙方相等的數據就會交換，這樣就可以一定程度保證兩路的數據量平衡    // 從i開始向後遍歷，如果遍歷的元素e=v，則停止遍歷    while (i <= r && arr[i].compareTo(v) < 0) {      i++;     }    // 從j開始向前遍歷，如果遍歷的元素e>v，則繼續向前遍歷，直到遍歷的元素e<=v，則停止遍歷    while (j >= l + 1 && arr[j].compareTo(v) > 0) {      j--;     }    if (i >= j) {      break;     }    swap(arr, i, j);    i++;    j--;   }  // 此時j指向的元素是數組中最後一個小於v的元素, i指向的元素是數組中第一個大於v的元素  swap(arr, l, j);  return j;} /<code>

三路快速排序

三路快速排序的步驟如下：

在雙路快速排序的基礎上，我們把等於v的元素單獨作為一個部分。lt指向小於v部分的最後一個元素，gt指向大於v部分的第一個元素。
從i開始向後遍歷，如果遍歷的元素e=v，則e直接合併到=v部分，然後i++繼續遍歷。如果遍歷的元素ev，則將e和>v部分前一個元素（gt-1指向的元素）交換，然後gt--，不過此時i不需要改變，因為i位置的元素是和gt位置前面的空白元素交換過來的。
遍歷完後i=gt，然後將l指向元素和lt指向元素交換。
對v部分進行以上操作。

三路快速排序相比雙路快速排序的優勢在於：減少了對重複元素的比較操作，因為重複元素在一次排序中就已經作為單獨一部分排好了，之後只需要對不等於該重複元素的其他元素進行排序。

三路快速排序代碼：

<code>public static void sort(Comparable[] arr) {  int n = arr.length;  sort(arr, 0, n - 1);}private static void sort(Comparable[] arr, int l, int r) {    // 對於小規模數組, 使用插入排序  if (r - l <= 15) {    InsertionSort.sort(arr, l, r);    return;   }  // 隨機在arr[l...r]的範圍中, 選擇一個數值作為標定點pivot  swap(arr, l, (int) (Math.random() * (r - l + 1)) + l);  Comparable v = arr[l];  int lt = l;   // arr[l+1...lt] < v  int gt = r + 1; // arr[gt...r] > v  int i = l + 1;  // arr[lt+1...i) == v  while (i < gt) {    if (arr[i].compareTo(v) < 0) {      swap(arr, i, lt + 1);      i++;      lt++;     } else if (arr[i].compareTo(v) > 0) {      swap(arr, i, gt - 1);      gt--;     } else { // arr[i] == v      i++;     }   }  swap(arr, l, lt);  sort(arr, l, lt - 1);  sort(arr, gt, r);}/<code>

總結

本文介紹了快速排序、快速排序的優化、雙路快速排序和三路快速排序。

對於快速排序，我們需要選擇合適的標定點，使得標定點的兩邊平衡；在快速排序中遞歸到小數組時，我們可以使用插入排序替換遞歸，減少不必要的開銷。

對於雙路快速排序和三路快速排序，我們使用的場合是數組中存在大量重複元素。

最後，提示一下 JDK 底層的排序使用的就是插入排序 + 雙路快速排序 + 歸併排序的組合。

分享到:

閱讀更多 放開我我還能學 的文章

關鍵字: 元素 ... 雙路

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"