PHP理論知識之12種排序算法的比較

常見的排序算法:

  • 快速排序、堆排序、歸併排序、選擇排序
  • 插入排序、二分插入排序
  • 冒泡排序、雞尾酒排序
  • 桶排序、計數排序、基數排序、位圖排序

一、快速排序

通過一趟排序將待排記錄分割成獨立的A、B兩部分,A部分全部小於基準值,B部分全部大於基準值。然後在對兩部分做相同的處理,已完成排序的功能。

算法描述與分析

  1. 從數列中挑選一個元素,作為基準值, pivot;
  2. 便利排序數列,比基準值小的放在左邊A,大的放在右邊B(相同的放在任意一邊)。待分組完成後基準值就處於A、B的中間位置。 這個過程稱為分區(partition)操作,兩種實現方式具體實現見代碼
  3. 遞歸排序A、B兩部分,重複上面1 2兩步,進行排序。
PHP理論知識之12種排序算法的比較

複雜度

時間複雜度:

A. o(nlogn)* : 將數組分解為一些列小問題進行獨立解決,上述的過程重複logn次得到有序的序列; 每次都需要對n個進行一次處理,所以時間複雜度為 n*logn

B. o(n^2): 固定選擇第一個元素做基準值,對倒序數組進行正序排列;每次劃分只得到一個比上一次劃分少一個記錄的子序列,每次只排一個。相當於向後冒泡排序,所以時間複雜度為o(n^2)

空間複雜度:

額外使用的空間需要看具體的代碼實現,理論上最優情況下空間複雜度為o(1),只是用一個交換空間; 如果考慮遞歸的實現邏輯則複雜度為 o(logn)

代碼實現

教科書式實現:

//普通方法實現
function quick_sort( &$arr, $left, $right ){

if( $left < $right){
//取基準值,取最左邊的一個元素
$pivot = $arr[$left];
//隨機取基準值 - 避免對倒序數組進行正序排序時,時間複雜度 O(n^2)的情況
// $k = rand($left, $right);
// swap($arr, $left, $k);
// $pivot = $arr[$left];
$i = $left; $j = $right;
//一趟排序比較
while($i < $j){
//基準值從左邊選取的,所以先從右側開始比較;反之亦然。(注)
while( $arr[$j] >= $pivot && $j > $i){
$j--;
}
swap($arr, $i, $j);
while( $arr[$i] < $pivot && $i < $j ){
$i++;
}
swap($arr, $i, $j);
}
quick_sort($arr, $left, $i-1); //對左邊內容進行排序
quick_sort($arr, $i+1, $right); //右邊內容進行排序
}
}
$arr = [49, 38, 65, 97, 76, 13, 27, 50];
quick_sort($arr, 0, count($arr)-1 );
echo implode(',', $arr);

劍指offer的實現:

//分區方法. 這個思想很重要,可以在多個問題中使用。如:取前幾名、字符串大小寫字母分組等
function partition(&$arr, $left, $right){
//隨機、取最後一個為基準值,方便從頭開始遍歷

$k = rand($left, $right);
swap($arr, $k, $right);
$pivot = $arr[$right];
// 取兩個指針A B,從{$left}開始走,B在遇到小於基準值是前走;
// 當A遇到小於基準值時和B處交換值;然後B指針前移一位。
// 完成一遍遍歷,B指針的位置就是分割位。在把基準值替換到B+1即可
$b = $left-1;
for($a=$left; $a<=$right; $a++){
if( $arr[$a] < $pivot){
$b++;
if( $a != $b){
swap($arr, $a, $b);
}
}
}
$b++; //指針後移一位,然後替換基準值,保證前面的都小、後面的都大
swap($arr, $b, $right);
return $b;
}
//交換元素。除了這種方式還可以使用:
// a=a+b; b=a-b ; a=a-b,加法來實現,不申請額外空間
// a=a^b; b = a^b; a = b^a,異或來實現
function swap(&$arr, $i, $j){
$t = $arr[$i];
$arr[$i] = $arr[$j];
$arr[$j] = $t;
}
//排序
function quick_sort( &$arr, $left, $right ){
if( $left < $right){
$index = partition($arr, $left, $right);
quick_sort($arr, $left, $index-1);
quick_sort($arr, $index+1, $right);
}
}
$arr = [49, 38, 65, 97, 76, 13, 27, 50];

quick_sort($arr, 0, count($arr)-1 );
echo implode(',', $arr);

運行耗時出現兩種情況:

A: 13,27,38,49,50,65,76,97[Finished in 0.2s]
B: 13,27,38,49,50,65,76,97[Finished in 0.1s]
原因:排序使用了隨機基準值的方法,所以分區比較、分區大小都是隨機的。所以遞歸次數會有不同,耗時自然也就不同。

二、堆排序

利用堆這種數據結構,堆積生成一個近似完全的二叉樹,並且滿足堆積性質:即子節點的建值總是小於(或大於)它的父節點。 二叉樹使用數組來實現,從頭到尾對應堆的從上到下。

示例

最大堆(父節點大於任何一個子節點),則根節點時最大值。將根節點取出來,剩下的進行堆調整生成最大堆;重複上述步驟,直到堆無節點時完成排序。

海量數據TopK問題

用堆排序來解決海量數據TopK 問題會非常好。構建K個節點的最小堆;遍歷數據,當數據大於最小根節點時替換根節點,進行堆調整,生成最小堆;遍歷結束時,堆會保存其中最大的K個元素; 在進行堆排序,生成K個元素從大到小的排列。

算法描述與分析:

我們這裡先介紹幾個問題,一步步推到堆排序。

什麼是堆

定義上面已有說明,示例如下:

PHP理論知識之12種排序算法的比較

使用數組存儲:$arr = [1, 2, 3, 17, 19, 36, 7, 15, 170]

堆調整

為了保證堆的特性而做的一個操作。將該根節點就行下沉操作,一直沉到合適的位置,使得剛才的子樹滿足堆的性質。

例如對最大堆進行堆調整:

1.對應的數組元素A[i], 左孩子 left(2i+1), 右孩子right(2i+2), 中找最大的那一個,將其下標存入largest中;

2.如果A[i] 是最大的元素,則程序直接結束;

3.否則,i的某個子節點為最大元素,將A[i] 與 A[largest] 交換;

4.在從交換的子子節點開始,重複1,2,3步,直到葉子節點,完成一次堆調整。

建堆

建堆就是一個不斷進行堆調整的過程。在數組中,我們一般從第n/2個數開始做堆調整,一直到下標為0的數 (因為下標大於n/2的數,都是葉子節點,無子數,所以其子數已經滿足堆的性質了)

堆調整隻判斷節點子樹,進行該節點下沉操作,並不和父節點進行比較,

所以建堆時必須從後向前進行,首先保證子樹滿足特性,在一步步往上推。

ps: 數組下標從0開始,建堆節點應從下標 n/2 -1 開始

堆排序

堆排序是在建堆完成之後,進行的操作。

以最大堆為例,堆以數組形式進行存儲,所以A[0]是最大值,將A[0]與A[n-1]交換,然後對A[0n-2]進行堆調整。第二次將A[0]與A[n-2]進行交換,A[0n-3]進行堆調整,重複這樣的操作直到A[0]與A[1]進行交換。 每次都將最大的數移入後面的區間,故操作完成之後,所得的數組就是從小到大有序排列的了。

堆排序圖解

PHP理論知識之12種排序算法的比較

PHP理論知識之12種排序算法的比較

複雜度

時間複雜度:

O(nlogn)* : 建堆過程為O(n), 堆調整過程為O(nlogn)

空間複雜度:

O(1) : 就地排序

代碼實現

$arr = [49, 38, 65, 97, 76, 13, 27, 50];
sortHeap($arr);
function sortHeap(&$arr){
$heap_size = count($arr) - 1;
createHeap($arr, $heap_size );
echo '建堆結果:'.implode(',', $arr)."\\r\\n";
heapPrint($arr, $heap_size);
//堆排序
$n = $heap_size;
for($i=0; $i<=$n; $i++ ){
swap($arr, 0, $heap_size); //最大值替換到最後面
$heap_size--;
adjustHeap($arr, $heap_size, 0); //A[0]替換為新的值,從該節點進行堆調整
}
echo '堆排序結果'.implode(',', $arr)."\\r\\n";
}
//建堆
function createHeap( &$arr, $heap_size){
$n = floor($heap_size/2) -1;
for($i=$n; $i>=0; $i-- ){
// 從最後一個非葉子節點開始,下標遞減進行建堆。
// 保證節點的子樹滿足堆的性質,才能進一步對節點的父節點進行堆調整; 否則會有問題
adjustHeap($arr, $heap_size, $i);
}
}
//堆調整 - 最大堆特性
function adjustHeap( &$arr, $heap_size, $i){
$left = 2*$i + 1; //左子節點
$right = 2*$i + 2; //右子節點
$largest = $i; //默認最大節點為當前節點
while( $left < $heap_size || $right if( $left < $heap_size && $arr[$left] > $arr[$largest] ){
$largest = $left; //左子節點大於目前值最大節點

}
if( $right $arr[$largest] ){
$largest = $right; //右子節點大於最大節點
}
//子節點大於該節點,需要將該節點下沉,並對下沉後的節點進行子樹堆調整
if($largest != $i){
swap($arr, $largest, $i);
$i = $largest;
$left = 2*$i+1;
$right = 2*$i+2;
}else{
// 該節點值是最大值時,結束調整。
// 因為:深層次的子樹在建堆時已經滿足堆性質,不需要再進行判斷
break;
}
}
}
function swap(&$arr, $i, $j){
$t = $arr[$i]; $arr[$i] = $arr[$j]; $arr[$j] = $t;
}
//堆打印
function heapPrint($arr, $heap_size){
//判斷有多少行
$rows = 1;
while( pow(2, $rows-1) < $heap_size ){ $rows++;}
//最後一行葉子節點的個數,最大個數
$lastNumbers = pow(2, $rows-1);
//輸出
$row = 1;
$num = pow(2, $row-1);
for( $i=0; $i $t = $lastNumbers/ ( pow(2, $row-1) +1 ); //空格平均分割。除以(數字個數+1)
$t = ceil($t);
for($j=0; $j echo $arr[$i];
if( $i+1 == $num ){
echo "\\r\\n";
$row++;
$num += pow(2, $row-1);
}

}
echo "\\r\\n";
}

運行結果:

建堆結果:97,76,65,38,49,13,27,50
97
76 65
38 49 13 27
堆排序結果: 13,27,38,49,50,65,76,97
[Finished in 0.2s]

三、歸併排序

歸併排序是 分治法(Divide and Conquer)的一個非常經典的應用。將大序列拆分成n個小序列,先使小序列有序,然後合併有序子序列,得到排序結果。

將兩個有序序列合併成一個序列的方法叫做2路歸併

算法描述與分析:

遞歸方法實現:

1.Divide: 把長度為n的序列分成長度為 n/2的子序列;

2.Conquer: 對每個子序列採用歸併排序;

3.Combine:將排序好的兩個子序列合併成最終的排序序列。

PHP理論知識之12種排序算法的比較

歸併操作的工作原理如下:

第一步:申請空間,使其大小為兩個已經排序序列之和,該空間用來存放合併後的序列

第二步:設定兩個指針最初位置分別為兩個已經排序序列的起始位置

第三步:比較兩個指針所指向的元素,選擇相對小的元素放入到合併空間,並移動指針到下一位置

重複步驟3直到某一指針超出序列尾

將另一序列剩下的所有元素直接複製到合併序列尾。

複雜度:

時間複雜度:

O(nlogn): 將序列分成小序列需要logn步,每一步合併都需要對n個元素進行比較,時間複雜度為O(n),故一共為 o(nlogn)

空間複雜度:

O(n)

代碼實現:

function mergeSort($arr){ 
$len = count($arr);
if($len<=1) return $arr;
$mid = intval($len/2);
$left = array_slice($arr, 0, $mid);
$right = array_slice($arr, $mid);
$a = mergeSort($left); //拆分排序子序列
$b = mergeSort($right); //
$arr = merge($a, $b); //合併,拆分幾次,就合併幾次
return $arr;
}
//2路合併
function merge($arrA, $arrB){
$arrC = [];
while ( count($arrA)>0 && count($arrB)>0 ) {
$arrC[] = ($arrA[0] < $arrB[0]) ? array_shift($arrA) : array_shift($arrB);
}

return array_merge($arrC, $arrA, $arrB);
}
$arr = [49, 38, 65, 97, 76, 13, 27, 50];
$arr = mergeSort($arr);
echo implode(',', $arr);

輸出結果:13,27,38,49,50,65,76,97[Finished in 0.2s]

四、插入排序

簡介:

構建有序序列,對於未排序數據,在已排序序列從後向前掃描,找到合適的位置K並插入。 位置K之後的元素需要全部後移。

算法描述與分析:

  1. 取第一個元素構建有序序列;
  2. 取出下一個元素B,對有序序列從後向前掃描; 如果掃描到的元素大於B,則後移該元素;否則將B插入該元素後面;
  3. 重複第2步,直到遍歷完所有數據。
PHP理論知識之12種排序算法的比較

複雜度:

時間:O(n^2)

空間:O(1)

代碼實現:

function insert_sort($arr){
for( $i =1; $i<count> $t = $arr[$i]; //待排元素
for($j=$i-1; $j>=0; $j--){
if( $arr[$j] > $t ){
$arr[$j+1] = $arr[$j]; //大於待排元素,則後移
}else{
break;
}
}
$arr[$j+1] = $t;
}
return $arr;
}
/<count>

五、二分插入排序

原理同上。 只是在第二步尋找合適位置時,使用二分查找法,快速定位插入位置K;然後將K後的元素後移;在K位置插入待排值

複雜度:

同插入排序。

代碼實現:

function binary_insertion_sort($arr){
$count = count($arr);
for( $i=1; $i $tmp = $arr[$i];
//查找需要替換的位置
$left = 0;
$right = $i-1;
while( $left <= $right){
$middle = intval( ($right+$left)/2 ); //向上加1
if( $arr[$middle] > $tmp){
$right = $middle-1;
}else{
$left = $middle+1;
}
}
//位置後的元素後移
for( $j; $j>=$left; $j--){
$arr[$j+1] = $arr[$j];
}
$arr[$left] = $tmp;
}
echo implode(',', $arr)."\\r\\n";
}

六、選擇排序

從待排序列中選擇最小(大)的元素,放在序列的起始位置;然後在從剩下的序列中繼續選擇最小(大)的元素,放在已排序序列的隊尾。

PHP理論知識之12種排序算法的比較

複雜度:

時間:O(n^2)

空間:O(1)

七、冒泡排序

兩層循環,外層循環次數=元素個數;

內層循環挨個比較,當 A[j] 大於 A[j+1]時交換兩個值;

當內循環結束時,最多有n-1次交換,會將最大值置於尾部;

當一次外循環無元素交換時,說明序列已有序,可提前結束外層循環。

複雜度

時間: o(n^2); 最優是已排序列進過一層循環發現無元素交換,直接退出程序,複雜度O(n)

空間:O(1)

八、雞尾酒排序

冒泡排序的變種,不同的地方在於從低到高後從高到低。一次層循環內完成一大一小兩個元素的冒泡。

PHP理論知識之12種排序算法的比較

function cocktail_sort($arr){
$i=1;
$start =0;
$len = count($arr)-1;
$end = 0;
while($i>0){ //有交換元素時繼續執行
$i=0;
for($j=$start; $j if( $arr[$j] > $arr[$j+1]){
$t = $arr[$j];
$arr[$j] = $arr[$j+1];
$arr[$j+1] = $t;
$i=1;

}
}
//逆向冒泡來一次
for($j=$len-$end; $j>$start; $j--){
if( $arr[$j] < $arr[$j-1]){
$t = $arr[$j];
$arr[$j] = $arr[$j-1];
$arr[$j-1] = $t;
$i=1;
}
}
$end++; //通過冒泡,尾部有序序列個數加一
$start++; //頭部有序序列個數加一
}
}

九、桶排序

將數組分別放到有限數量的桶中。每個桶在進行獨立的排序。 分桶要求桶中的最大數據小於下一個桶的最小數據。

複雜度

時間:

空間: O(N+M)


十、計數排序

1.找出待排序列的最大值和最小值;使用數組C來標識 C[min] - c[max];

2.統計數組中每個值出現的次數,存入C[i]中;

3.反向填充目標數組:順序遍歷這個數組C,將下標解釋成數據, 將該位置的值表示該數據的重複數量,得到排序好的數組。

  1. 當輸入的元素是n 個0到k之間的整數時,它的運行時間是 O(n + k)。計數排序不是比較排序,排序的速度快於任何比較排序算法。
  2. 只能對整數進行排序

複雜度

時間:O(n)

空間:最大O(2n)


十一、基數排序

將整數按位數切割成不同的數字,然後按每個位數分別比較。


十二、位圖排序

要求數據不重複,用bit位進行位圖排序,能節省空間。

譬如: 每個學生答題一次,將已答題的學號記錄在文件中。學號只出現一次,且學號連續。輸入一個學號,查看是否答題。

解決: 將學號進行排序,在查找時使用二分查找。 因為學號不重複,所以可使用位圖排序。

複雜度

位圖排序不是比較排序,時間複雜度為 O(n)


分享到:


相關文章: