【算法】排序算法之計數排序

前幾回,我們已經對 、 、 、 、 、 、 做了說明分析。本回,將對計數排序

進行相關說明分析。


一、排序算法系列目錄說明

  • 冒泡排序(Bubble Sort)
  • 插入排序(Insertion Sort)
  • 希爾排序(Shell Sort)
  • 選擇排序(Selection Sort)
  • 快速排序(Quick Sort)
  • 歸併排序(Merge Sort)
  • 堆排序(Heap Sort)
  • 計數排序(Counting Sort)
  • 桶排序(Bucket Sort)
  • 基數排序(Radix Sort)

  • 二、計數排序(Counting Sort)

    計數排序(Counting sort)是一種穩定的線性時間排序算法。

    1. 基本思想

    計數排序使用一個額外的數組C,其中第i個元素是待排序數組A中值等於i的元素的個數。

    計數排序的核心在於將輸入的數據值轉化為鍵存儲在額外開闢的數組空間中。作為一種線性時間複雜度的排序,計數排序要求輸入的數據必須是有確定範圍的整數。

    用來計數的數組C的長度取決於待排序數組中數據的範圍(等於待排序數組的最大值與最小值的差加上1),然後進行分配、收集處理:

    ① 分配。掃描一遍原始數組,以當前值-minValue作為下標,將該下標的計數器增1。

    ② 收集。掃描一遍計數器數組,按順序把值收集起來。

    2. 實現邏輯

    ① 找出待排序的數組中最大和最小的元素

    ② 統計數組中每個值為i的元素出現的次數,存入數組C的第i項

    ③ 對所有的計數累加(從C中的第一個元素開始,每一項和前一項相加)

    ④ 反向填充目標數組:將每個元素i放在新數組的第C(i)項,每放一個元素就將C(i)減去1

    3. 動圖演示

    【算法】排序算法之計數排序

    計數排序演示

    舉個例子,假設有無序數列nums=[2, 1, 3, 1, 5], 首先掃描一遍獲取最小值和最大值,maxValue=5, minValue=1,於是開一個長度為5的計數器數組counter

    (1) 分配

    統計每個元素出現的頻率,得到counter=[2, 1, 1, 0,

    1],例如counter[0]表示值0+minValue=1出現了2次。

    (2) 收集

    counter[0]=2表示1出現了兩次,那就向原始數組寫入兩個1,counter[1]=1表示2出現了1次,那就向原始數組寫入一個2,依次類推,最終原始數組變為[1,1,2,3,5],排序好了。

    4. 複雜度分析

    平均時間複雜度:O(n + k)

    最佳時間複雜度:O(n + k)

    最差時間複雜度:O(n + k)

    空間複雜度:O(n + k)

    當輸入的元素是n 個0到k之間的整數時,它的運行時間是 O(n + k)。。在實際工作中,當k=O(n)時,我們一般會採用計數排序,這時的運行時間為O(n)。

    計數排序需要兩個額外的數組用來對元素進行計數和保存排序的輸出結果,所以空間複雜度為O(k+n)。

    計數排序的一個重要性質是它是穩定的:具有相同值的元素在輸出數組中的相對次序與它們在輸入數組中的相對次序是相同的。也就是說,對兩個相同的數來說,在輸入數組中先出現的數,在輸出數組中也位於前面。

    計數排序的穩定性很重要的一個原因是:計數排序經常會被用於基數排序算法的一個子過程。我們將在後面文章中介紹,為了使基數排序能夠正確運行,計數排序必須是穩定的。

    5. 代碼實現

    C版本:

    <code>// 計數排序(C)
    #include <stdio.h>
    #include <stdlib.h>
    #include <time.h>
    void print_arr(int *arr, int n) {
    \tint i;
    \tprintf("%d", arr[0]);
    \tfor (i = 1; i < n; i++)
    \t\tprintf(" %d", arr[i]);
    \tprintf("\\n");
    }
    void counting_sort(int *ini_arr, int *sorted_arr, int n) {
    \tint *count_arr = (int *) malloc(sizeof(int) * 100);
    \tint i, j, k;
    \tfor (k = 0; k < 100; k++)
    \t\tcount_arr[k] = 0;
    \tfor (i = 0; i < n; i++)

    \t\tcount_arr[ini_arr[i]]++;
    \tfor (k = 1; k < 100; k++)
    \t\tcount_arr[k] += count_arr[k - 1];
    \tfor (j = n; j > 0; j--)
    \t\tsorted_arr[--count_arr[ini_arr[j - 1]]] = ini_arr[j - 1];
    \tfree(count_arr);
    }
    int main(int argc, char **argv) {
    \tint n = 10;
    \tint i;
    \tint *arr = (int *) malloc(sizeof(int) * n);
    \tint *sorted_arr = (int *) malloc(sizeof(int) * n);
    \tsrand(time(0));
    \tfor (i = 0; i < n; i++)
    \t\tarr[i] = rand() % 100;
    \tprintf("ini_array: ");
    \tprint_arr(arr, n);
    \tcounting_sort(arr, sorted_arr, n);
    \tprintf("sorted_array: ");
    \tprint_arr(sorted_arr, n);
    \tfree(arr);
    \tfree(sorted_arr);
    \treturn 0;
    }/<time.h>/<stdlib.h>/<stdio.h>/<code>

    Java版本:

    <code>// 計數排序(Java)
    public class CountingSort {
    public static void main(String[] argv) {
    int[] A = CountingSort.countingSort(new int[]{16, 4, 10, 14, 7, 9, 3, 2, 8, 1});
    Utils.print(A);
    }
    public static int[] countingSort(int[] A) {
    int[] B = new int[A.length];
    // 假設A中的數據a'有,0<=a' && a' < k並且k=100
    int k = 100;
    countingSort(A, B, k);
    return B;
    }
    private static void countingSort(int[] A, int[] B, int k) {
    int[] C = new int[k];
    // 計數
    for (int j = 0; j < A.length; j++) {
    int a = A[j];
    C[a] += 1;
    }
    Utils.print(C);
    // 求計數和

    for (int i = 1; i < k; i++) {
    C[i] = C[i] + C[i - 1];
    }
    Utils.print(C);
    // 整理
    for (int j = A.length - 1; j >= 0; j--) {
    int a = A[j];
    B[C[a] - 1] = a;
    C[a] -= 1;
    }
    }
    }/<code>

    6. 優化改進

    場景分析:舉個極端的例子:如果排序的數組有200W個元素,但是這200W個數的值都在1000000-1000100,也就說有100個數,總共重複了200W次,現在要排序,怎麼辦?

    這種情況排序,計數排序應該是首選。但是這時候n的值為200W,如果按原來的算法,k的值10001000,但是此時c中真正用到的地方只有100個,這樣對空間造成了極大的浪費。

    改進思路:針對c數組的大小,優化計數排序

    改進代碼:

    <code>// 計數排序優化(Java)
    // 針對c數組的大小,優化計數排序
    public class CountSort{
    \tpublic static void main(String []args){

    \t\t//排序的數組
    \t\tint a[] = {100, 93, 97, 92, 96, 99, 92, 89, 93, 97, 90, 94, 92, 95};
    \t\tint b[] = countSort(a);
    \t\tfor(int i : b){
    \t\t\tSystem.out.print(i + " ");
    \t\t}
    \t\tSystem.out.println();
    \t}
    \tpublic static int[] countSort(int []a){
    \t\tint b[] = new int[a.length];
    \t\tint max = a[0], min = a[0];
    \t\tfor(int i : a){
    \t\t\tif(i > max){
    \t\t\t\tmax = i;
    \t\t\t}
    \t\t\tif(i < min){
    \t\t\t\tmin = i;
    \t\t\t}
    \t\t}
    \t\t//這裡k的大小是要排序的數組中,元素大小的極值差+1
    \t\tint k = max - min + 1;
    \t\tint c[] = new int[k];
    \t\tfor(int i = 0; i < a.length; ++i){
    \t\t\tc[a[i]-min] += 1;//優化過的地方,減小了數組c的大小
    \t\t}
    \t\tfor(int i = 1; i < c.length; ++i){
    \t\t\tc[i] = c[i] + c[i-1];
    \t\t}
    \t\tfor(int i = a.length-1; i >= 0; --i){
    \t\t\tb[--c[a[i]-min]] = a[i];//按存取的方式取出c的元素
    \t\t}
    \t\treturn b;
    \t}
    }/<code>

    三、總結

    計數算法只能使用在已知序列中的元素在0-k之間,且要求排序的複雜度在線性效率上。

    計數排序和基數排序很類似,都是非比較型排序算法。但是,它們的核心思想是不同的,基數排序主要是按照進制位對整數進行依次排序,而計數排序主要側重於對有限範圍內對象的統計。基數排序可以採用計數排序來實現。

    下一篇預告:桶排序(Bucket Sort)。欲知詳情,且聽下回分解。


    PS: 更多精選內容資源分享,歡迎關注微信公眾號:『 developer1024 』


    分享到:


    相關文章: