利用反彙編手段解析C語言函數

2020-02-13 20:28:56 技匠志

1、問題的提出

函數是 C語言中的重要概念。利用好函數能夠充分利用系統庫的功能寫出模塊獨立、易於維護和修改的程序。函數並不是 C 語言獨有的概念，其他語言中的方法、過程等本質上都是函數。

2、解決方法

在《微機原理》課程介紹了堆棧、彙編語言等必要的相關知識之後，通過在高級語言開發環境下反彙編C 語言程序代碼，使得學生通過分析彙編代碼來理解函數調用中的堆棧變化，可以在實踐中理解高級語言和低級語言的底層映射關係，理解函數調用的實質。本文通過在 Visual C++6.0 下反彙編一個 32 位 C語言程序的部分代碼來解析解釋函數調用的具體過程。

3、函數調用過程

函數調用過程主要由參數傳遞、地址跳轉、局部變量分配和賦初值、執行函數體，結果返回等幾個步驟組成[1]。

3.1、參數傳遞及函數跳轉

參數由實參傳遞給形參。在底層實現上，即是實參按照函數調用規定壓入堆棧。參數傳遞完成後就通過CALL指令由當前程序跳轉到子程序處。

3.2、局部變量分配並賦值

函數的"{"被認為是分配局部變量空間的時機。在彙編層面局部變量分配體現為堆棧中以 EBP 寄存器為基址向低地址端分配的一個連續區域，通過 EBP 寄存器的相對尋址方式來尋址函數內的局部變量。由於堆棧增長的方向是高地址端到低地址端，因此函數中先定義的局部變量地址較大，後定義的變量地址逐漸變小，相鄰定義的變量其地址一定相鄰[2]。由於全局數據和局部數據定義在不用的數據區而並不與局部變量相鄰，根據程序局部性原理，相鄰的數據會被緩存，因此對相同的運算，局部變量作為操作數的運算效率就可能高於有全局變量參與的運算。同時，局部變量分配和回收只需要移動堆棧指針ESP，因此效率最高。

3.3、尋址函數的參數

參數存放在以 EBP 為基址的高地址端。對參數的訪問同樣是通過EBP 寄存器相對尋址操作來實現。

3.4、執行函數體內的語句

函數內和具體功能相關的語句被轉化成一系列彙編語句。

3.5、返回值

return 語句將返回值返回到主調函數。在底層，參數是通過 EAX 寄存器或 EDX 寄存器傳遞給主調函數。

3.6、返回主調函數

函數的"}"被解釋為函數體已經執行完。遇到"}"時，會將堆棧中的局部變量、程序中壓入堆棧的寄存器的值全部彈出，將之前 CALL指令執行時壓入堆棧的函數返回地址彈到指令指針寄存器 EIP，從而返回到主調函數。

3.7、堆棧平衡

堆棧平衡指的是將函數調用前壓入堆棧的參數彈出堆棧，使堆棧恢復到其調用前的狀態[3]。由於函數調用完成後，參數就是無用的數據了，因此需要將其移出堆棧。

在 C語言中不需要進行堆棧平衡。而在彙編層面上卻根據調用約定來確定由主調函數或是被調函數完成堆棧平衡。

C語言函數調用堆棧常見形式如圖 1 所示[4]：

參數由主調函數壓入堆棧，CALL 指令將函數返回地址入棧。進入子函數後，需要保存 EBP 原值、分配局部變量空間、保存寄存器初始值。函數內通過"EBP-位移量"方式訪問局部變量，通過"EBP+位移量"方式訪問參數[5]。

每發生一次函數調用，就會在堆棧中建立一個棧幀，棧幀在函數調用後釋放。但是系統的堆棧資源有限，因此如果函數調用（如遞歸調用）層數過多，則可能發生堆棧溢出錯誤。

4.反彙編代碼分析

以下將函數 function 的調用相關代碼在VisualC++6.0 Debug模式反彙編，通過對彙編代碼的分析揭示函數調用的關鍵點和細節。完整的 C語言程序代碼如圖 2 所示：

Function(i，&j)語句的反彙編代碼如圖 3 所示：

先找到主函數中的局部變量 i，j（其在堆棧中位置為 EBP- 8和 EBP- 4），將其壓入堆棧。Visual C/C++的編譯器對 C 語言程序的默認函數約定為 _cdecl[6]。此參數入棧約定為自右向左，並且對函數名前加"_"修飾符。先將 j 的地址壓入堆棧，後將 i 的值壓入堆

棧。通過 call 指令調用函數。從 Call 指令可見 fuction函數編譯後加了"_"修飾符。Call 指令執行時自動將函數的返回地址入棧，之後轉到 function 定義處開始執行此函數。

對funciton函數的"{"的反彙編結果如圖 4 所示：

在函數內，遇到"{"時分配局部空間，並用值"0xCCH"進行初始化。未在定義時初始化的局部變量其初值就與"0xCCH"相關。因此 int 類型變量由於佔四個字節，其初值為 - 858993460（0xCCCCC-CCCH）；兩個連續的 0xCCH 對應漢字"燙"字，因此當

以字符形式顯示函數內未初始化的變量時會顯示為"燙燙…"；指針類型變量就指向了地址為 0xCCCC-CCH 的內存。由此在調試模式下能很容易發現未初始化的變量。

堆棧基本的存儲單位為四字節，對於小於四字節的數據按四字節對齊方式分配空間。因此 char 類型變量 ch 雖然數據本身需要兩個字節，也分配了四個字節空間。array 字節數組分配空間時每個字符佔一個字節，不夠四個字符時按四字節對齊存放。因此局部變量

空間總數為 40H+4+4×2+4=50H。局部變量 ch 的地址為 EBP- 4，a、b 的地址分別為 EBP- 8 ，EBP- 0CH,array數組的地址為 EBP- 10h。函數左括號右括號間的所有的語句反彙編結果如圖 5 所示：

若變量有初值，則反彙編就會為其生成一條 Mov指令為其賦值。對於沒有初值的變量其每個字節都為0xCCH。對於字符數組，情況稍微複雜一些。字符串常量"abc"被存放在全局數據區中。當需要引用其值對數組進行初始化時，實際是將全局數據拷貝到堆棧中的

局部數組 array裡。由於寄存器是 32 位，每次最多隻能賦值 4 個字符，因此對數組賦初值的語句反彙編後可能產生一至多條彙編語句。對數組內容的訪通過[ "EBP+ 數組首地址 + 偏移量]的寄存器間址來完成，因此局部數組初始化費時但訪問時的效率高。

在函數內訪問局部變量和參數通過 [EBP + 位移量 /- 位移量]來完成。函數返回值被放到 EAX 寄存器中供主調函數使用。

可見，在彙編層面上，函數內部並不存儲局部變量，局部變量只有當函數調用發生時才會在棧上為函數分配空間。因此當函數調用後返回局部變量的值是錯誤的。

遇到函數"}"時的操作如圖 6 所示：

將寄存器 EDI、ESI、EBX 恢復原值；將 ESP 調回到 EBP 處；將 EBP原值彈出。此時 ESP 指向函數返回地址。執行出棧指令，將函數的返回地址彈入 EIP 寄存器返回到主調函數。此時堆棧中只殘留有調用函數時壓入的參數還沒有清理。

主調函數中的堆棧平衡語句如圖 7 所示：

根據 _cdecl 約定，需要由主調函數完成堆棧平衡。主調函數根據壓入堆棧的參數的數目 2 和參數大小，利用指令 add ESP，8 將參數全部彈出。此時堆棧就恢復到其調用前的狀態。一個完整的函數調用過程完成。

分享到:

閱讀更多 技匠志 的文章

關鍵字: C語言堆棧反彙編

C語言，實現12306火車售票系統！附源碼，項目實戰！

C++編程筆記：《C語言》—— 數組知識詳解，學編程建議收藏！

【C語言】a+=b和a=a+b 真的完全等價嗎？a[i] = i++ 到底對不對？

最值得收藏的 C語言 " 指針 " 解析文章！通俗易懂易上手，超讚！

高級語言程序設計：C語言

值得收藏的 C語言指針講解文章

C語言 #define 和 typedef 對數據類型起別名的區別

C語言#include命令尖括號和雙引號的區別

C語言環形隊列

C語言鏈棧

那些主流編程語言的知識，C語言

02.25 「C語言」- static和extern關鍵字

C語言判斷奇偶性

「C語言」指向一維數組元素的指針！學習不要帶口罩，只要帶腦子

C語言每日小練

堆排序算法 -- C語言

C語言——結果的誕生過程

C語言、嵌入式重點知識：回調函數

c語言：從零開始的編程之旅

C語言指針入門看這一篇就夠了

01.25 C語言，數組循環哪家好，指針or下標？

C語言小白入門之「C語言 " 函數 "」

「C語言」超詳細思維導圖

C語言：九九乘法表解析及程序邏輯分析

C語言，逗號操作符的妙用，值得一看

C語言——你可能不知道的printf

12.25 C語言-堆排序（Heap Sort）

C語言——直接打印一個六芒星

C語言——你知道魔方陣麼？

零基礎學習編程如何選擇？C語言、C++、java還是python？

2. C語言——printf 的花式操作

C語言：scanf()函數學習攻略

難題｜三道 C語言中逆天難題，極度糾結

C語言：程序運行成功了，卻還是存在錯誤

C語言：像輸出hello world一樣，輸出整型浮點型數據的取值範圍

編程java視頻自學教程，C語言

C語言，能開發什麼？怎麼去學習？（文末全套視頻教程領取）

C語言：冒泡排序，經典的排序算法

「C語言」編程學習—控制語句goto語句解析！

「C語言」代碼必備——編譯器，那你知道交叉編譯是什麼嗎？

C語言——經典之雙向鍊表的實現

06.04 快速上手系列-C語言

快速上手系列-C語言

C語言：Windows編程入門

C語言【數據結構與算法】堆排序

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"