數據結構27｜遞歸樹：如何藉助樹來求解遞歸算法的時間複雜度？

2018-12-13 19:28:55 xiuxiuing

加關注可以第一時間接收數據結構系列文章，覺得不錯可以轉發和點贊，謝謝支持

今天，我們來講樹這種數據結構的一種特殊應用，遞歸樹。

我們都知道，遞歸代碼的時間複雜度分析起來很麻煩。我們在第 12 節《排序（下）》那裡講過，如何利用遞推公式，求解歸併排序、快速排序的時間複雜度，但是，有些情況，比如快排的平均時間複雜度的分析，用遞推公式的話，會涉及非常複雜的數學推導。

除了用遞推公式這種比較複雜的分析方法，有沒有更簡單的方法呢？今天，我們就來學習另外一種方法，藉助遞歸樹來分析遞歸算法的時間複雜度。

遞歸樹與時間複雜度分析

我們前面講過，遞歸的思想就是，將大問題分解為小問題來求解，然後再將小問題分解為小小問題。這樣一層一層地分解，直到問題的數據規模被分解得足夠小，不用繼續遞歸分解為止。

如果我們把這個一層一層的分解過程畫成圖，它其實就是一棵樹。我們給這棵樹起一個名字，叫作

遞歸樹。我這裡畫了一棵斐波那契數列的遞歸樹，你可以看看。節點裡的數字表示數據的規模，一個節點的求解可以分解為左右子節點兩個問題的求解。

通過這個例子，你對遞歸樹的樣子應該有個感性的認識了，看起來並不複雜。現在，我們就來看，如何用遞歸樹來求解時間複雜度。

歸併排序算法你還記得吧？它的遞歸實現代碼非常簡潔。現在我們就藉助歸併排序來看看，如何用遞歸樹，來分析遞歸代碼的時間複雜度。

歸併排序的原理我就不詳細介紹了，如果你忘記了，可以回看一下第 12 節的內容。歸併排序每次會將數據規模一分為二。我們把歸併排序畫成遞歸樹，就是下面這個樣子：

因為每次分解都是一分為二，所以代價很低，我們把時間上的消耗記作常量 1。歸併算法中比較耗時的是歸併操作，也就是把兩個子數組合併為大數組。從圖中我們可以看出，每一層歸併操作消耗的時間總和是一樣的，跟要排序的數據規模有關。我們把每一層歸併操作消耗的時間記作 n。

現在，我們只需要知道這棵樹的高度 h，用高度 h 乘以每一層的時間消耗n，就可以得到總的時間複雜度 O(n∗h)。

從歸併排序的原理和遞歸樹，可以看出來，歸併排序遞歸樹是一棵滿二叉樹。我們前兩節中講到，滿二叉樹的高度大約是 log2 n，所以，歸併排序遞歸實現的時間複雜度就是 O(nlogn)。我這裡的時間複雜度都是估算的，對樹的高度的計算也沒有那麼精確，但是這並不影響複雜度的計算結果。

利用遞歸樹的時間複雜度分析方法並不難理解，關鍵還是在實戰，所以，接下來我會通過三個實際的遞歸算法，帶你實戰一下遞歸的複雜度分析。學完這節課之後，你應該能真正掌握遞歸代碼的複雜度分析。

實戰一：分析快速排序的時間複雜度

在用遞歸樹推導之前，我們先來回憶一下用遞推公式的分析方法。你可以回想一下，當時，我們為什麼說用遞推公式來求解平均時間複雜度非常複雜？

快速排序在最好情況下，每次分區都能一分為二，這個時候用遞推公式 T(n)=2T(n/2)+n，很容易就能推導出時間複雜度是 O(nlogn)。但是，我們並不可能每次分區都這麼幸運，正好一分為二。

我們假設平均情況下，每次分區之後，兩個分區的大小比例為 1:k。當 k=9 時，如果用遞推公式的方法來求解時間複雜度的話，遞推公式就寫成 T(n)=T(n/10)+T(9n/10)+n。

這個公式可以推導出時間複雜度，但是推導過程非常複雜。那我們來看看，用遞歸樹來分析快速排序的平均情況時間複雜度，是不是比較簡單呢？

我們還是取 k 等於 9，也就是說，每次分區都很不平均，一個分區是另一個分區的 9 倍。如果我們把遞歸分解的過程畫成遞歸樹，就是下面這個樣子：

快速排序的過程中，每次分區都要遍歷待分區區間的所有數據，所以，每一層分區操作所遍歷的數據的個數之和就是 n。我們現在只要求出遞歸樹的高度 h，這個快排過程遍歷的數據個數就是 h∗n ，也就是說，時間複雜度就是 O(h∗n)。

因為每次分區並不是均勻地一分為二，所以遞歸樹並不是滿二叉樹。這樣一個遞歸樹的高度是多少呢？

我們知道，快速排序結束的條件就是待排序的小區間，大小為 1，也就是說葉子節點裡的數據規模是 1。從根節點 n 到葉子節點 1，遞歸樹中最短的一個路徑每次都乘以 1/10，最長的一個路徑每次都乘以 9/10。通過計算，我們可以得到，從根節點到葉子節點的最短路徑是 log10 n，最長的路徑是 log10/9 n。

所以，遍歷數據的個數總和就介於 nlog10 n 和 nlog10/9 n 之間。根據複雜度的大 O 表示法，對數複雜度的底數不管是多少，我們統一寫成 log n，所以，當分區大小比例是 1:9 時，快速排序的時間複雜度仍然是 O(nlog n)。

剛剛我們假設 k=9 ，那如果 k=99 ，也就是說，每次分區極其不平均，兩個區間大小是 1:99 ，這個時候的時間複雜度是多少呢？

我們可以類比上面 k=9 的分析過程。當 k=99 的時候，樹的最短路徑就是 log100 n，最長路徑是 log100/99 n，所以總遍歷數據個數介於 nlog100 n 和 nlog100/99 n 之間。儘管底數變了，但是時間複雜度也仍然是 O(nlogn)。

也就是說，對於 k 等於 9，99，甚至是 999，9999……，只要 k 的值不隨 n 變化，是一個事先確定的常量，那快排的時間複雜度就是 O(nlogn)。所以，從概率論的角度來說，快排的平均時間複雜度就是 O(nlogn)。

實戰二：分析斐波那契數列的時間複雜度

在遞歸那一節中，我們舉了一個跨臺階的例子，你還記得嗎？那個例子實際上就是一個斐波那契數列。為了方便你回憶，我把它的代碼實現貼在這裡。

int f(int n) {

if (n == 1) return 1;

if (n == 2) return 2;

return f(n-1) + f(n-2);

}

這樣一段代碼的時間複雜度是多少呢？你可以先試著分析一下，然後再來看，我是怎麼利用遞歸樹來分析的。

我們先把上面的遞歸代碼畫成遞歸樹，就是下面這個樣子：

這棵遞歸樹的高度是多少呢？

f(n) 分解為 f(n−1)和 f(n−2)，每次數據規模都是 −1 或者 −2，葉子節點的數據規模是 1 或者 2。所以，從根節點走到葉子節點，每條路徑是長短不一的。如果每次都是 −1，那最長路徑大約就是 n；如果每次都是 −2，那最短路徑大約就是 n/2。

每次分解之後的合併操作只需要一次加法運算，我們把這次加法運算的時間消耗記作 1。所以，從上往下，第一層的總時間消耗是 1，第二層的總時間消耗是 2，第三層的總時間消耗就是 2*2。依次類推，第 k 層的時間消耗就是 2 的k−1次方，那整個算法的總的時間消耗就是每一層時間消耗之和。

如果路徑長度都為 n，那這個總和就是 2的n次方−1。

如果路徑長度都是 n/2 ，那整個算法的總的時間消耗就是 2n/2 −1。

所以，這個算法的時間複雜度就介於 O(2n) 和 O(2n/2) 之間。雖然這樣得到的結果還不夠精確，只是一個範圍，但是我們也基本上知道了上面算法的時間複雜度是指數級的，非常高。

實戰三：分析全排列的時間複雜度

前面兩個複雜度分析都比較簡單，我們再來看個稍微複雜的。

我們在高中的時候都學過排列組合。“如何把 n 個數據的所有排列都找出來”，這就是全排列的問題。

我來舉個例子。比如，1，2，3 這樣 3 個數據，有下面這幾種不同的排列：

1, 2, 3

1, 3, 2

2, 1, 3

2, 3, 1

3, 1, 2

3, 2, 1

如何編程打印一組數據的所有排列呢？這裡就可以用遞歸來實現。

如果我們確定了最後一位數據，那就變成了求解剩下 n−1 個數據的排列問題。而最後一位數據可以是 n 個數據中的任意一個，因此它的取值就有 n 種情況。所以，“n 個數據的排列”問題，就可以分解成 n 個“n−1 個數據的排列”的子問題。

如果我們把它寫成遞推公式，就是下面這個樣子：

假設數組中存儲的是 1，2， 3...n。

f(1,2,...n) = {最後一位是 1, f(n-1)} + {最後一位是 2, f(n-1)} +...+{最後一位是 n, f(n-1)}。

如果我們把遞推公式改寫成代碼，就是下面這個樣子：

// 調用方式：

// int[]a = a={1, 2, 3, 4}; printPermutations(a, 4, 4);

// k 表示要處理的子數組的數據個數

public void printPermutations(int[] data, int n, int k) {

if (k == 1) {

for (int i = 0; i < n; ++i) {

System.out.print(data[i] + " ");

}

System.out.println();

}

for (int i = 0; i < k; ++i) {

int tmp = data[i];

data[i] = data[k-1];

data[k-1] = tmp;

printPermutations(data, n, k - 1);

tmp = data[i];

data[i] = data[k-1];

data[k-1] = tmp;

}

如果不用我前面講的遞歸樹分析方法，這個遞歸代碼的時間複雜度會比較難分析。現在，我們來看下，如何藉助遞歸樹，輕鬆分析出這個代碼的時間複雜度。

首先，我們還是畫出遞歸樹。不過，現在的遞歸樹已經不是標準的二叉樹了。

第一層分解有 n 次交換操作，第二層有 n 個節點，每個節點分解需要 n−1 次交換，所以第二層總的交換次數是 n∗(n−1。第三層有 n∗(n−1) 個節點，每個節點分解需要 n−2 次交換，所以第三層總的交換次數是 n∗(n−1)∗(n−2)。

以此類推，第 k 層總的交換次數就是 n∗(n−1)∗(n−2)∗…∗(n−k+1)。最後一層的交換次數就是 n∗(n−1)∗(n−2)∗…∗2∗1。每一層的交換次數之和就是總的交換次數。

n + n*(n-1) + n*(n-1)*(n-2) +... + n*(n-1)*(n-2)*...*2*1

這個公式的求和比較複雜，我們看最後一個數，n∗(n−1)∗(n−2)∗…∗2∗1 等於 n!，而前面的 n−1 個數都小於最後一個數，所以，總和肯定小於 n∗n!，也就是說，全排列的遞歸算法的時間複雜度大於 O(n!)，小於 O(n∗n!)，雖然我們沒法知道非常精確的時間複雜度，但是這樣一個範圍已經讓我們知道，全排列的時間複雜度是非常高的。

這裡我稍微說下，掌握分析的方法很重要，思路是重點，不要糾結於精確的時間複雜度到底是多少。

內容小結

今天，我們用遞歸樹分析了遞歸代碼的時間複雜度。加上我們在排序那一節講到的遞推公式的時間複雜度分析方法，我們現在已經學習了兩種遞歸代碼的時間複雜度分析方法了。

有些代碼比較適合用遞推公式來分析，比如歸併排序的時間複雜度、快速排序的最好情況時間複雜度；有些比較適合採用遞歸樹來分析，比如快速排序的平均時間複雜度。而有些可能兩個都不怎麼適合使用，比如二叉樹的遞歸前中後序遍歷。

時間複雜度分析的理論知識並不多，也不復雜，掌握起來也不難，但是，在我們平時的工作、學習中，面對的代碼千差萬別，能夠靈活應用學到的複雜度分析方法，來分析現有的代碼，並不是件簡單的事情，所以，你平時要多實戰、多分析，只有這樣，面對任何代碼的時間複雜度分析，你才能做到遊刃有餘、毫不畏懼。

分享到:

閱讀更多 xiuxiuing 的文章

關鍵字: 數據結構技術二叉樹

Redis設計與實現: redisObject 數據結構，以及 Redis 的數據類型

數據結構-圖（圖的基本實現C++）

python 數據結構

零基礎入門Python：基本命令、函數、數據結構

詳解 HashMap 數據結構

五大集合(數據結構)要點

java 數據結構-隊列詳解

嚴蔚敏《數據結構》（C語言版）筆記和習題（含考研真題）詳解

木蘭編程語言入門教程之五——數據結構

【數據結構】秒懂系列:數據結構-堆(Heap)

【數據結構】秒懂系列:數據結構-樹-(B+樹)

數據結構順序表（c語言）

二叉樹的遍歷-數據結構

數據結構--圖

數據結構——動手實戰雙向鏈表

03.05 數據結構——動手實戰雙向鏈表

數據結構-二叉樹以及遍歷代碼

03.01 數據結構--選擇排序

03.01 數據結構--插入排序

03.01 數據結構--快速排序

03.01 數據結構--冒泡排序

數據結構——30行代碼實現棧和模擬遞歸

01.數據結構

11.25 安卓系統權限檢查機制，存儲位置，數據結構

「數據結構」字符串排序算法最全總結

Python3 數據結構

「數據結構」Hash表

深入理解Linux內核中EPOLL機制系列(一)數據結構

09.26 數據結構：有了二叉查找樹、平衡樹為啥還需要紅黑樹？

數據結構：數組詳細介紹，你足夠了解數組的特性和使用場景嗎？

數據結構-隊列

數據結構-隊列，你會了嗎？

數據結構-棧

數據結構-數組

抽象數據類型、數據結構、算法與Java語言：ADT List

抽象數據類型、數據結構、算法與Java語言：ADT Queue（隊列）

02.26 Python3 自學第9天：數據結構

打破認知：程序設計 = 算法 + 數據結構？

01.09 面試必問的ConcurrentHashMap實現原理：數據結構、get與put操作

數據結構：實現一個隊列，並完成各個接口的實現

數據結構——並查集

spark2.0機器學習——數據結構

2018最新BAT技術面試78題：數據結構+網絡+NoSQL+分布式架構！

計算機二級《數據結構》知識點總結

數據結構-棧結構實現（java）

數據結構-單向鍊表實現（java）

數據結構-順序表基礎實現（java）

比特幣源碼解析(7)-數據結構-區塊

數據結構——哈希表

03.23 數據結構——哈希表

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"