CPU 到底是怎麼識別代碼的?


CPU 到底是怎麼識別代碼的?

作者:Zign 鏈接https://www.zhihu.com/question/348237008/answer/843382847

最近讀到這樣一篇好文章,從底層硬件角度出發剖析了一下CPU對代碼的識別和讀取,內容非常精彩,讀完感覺大學裡學到的很多東西瞬間聯繫起來了,這裡分享給大家,希望能認真讀完並有所收穫。

CPU 到底是怎麼識別代碼的?

首先要開始這個話題要先說一下半導體。

啥叫半導體?

半導體其實就是介於導體和絕緣體中間的一種東西,比如二極管。

CPU 到底是怎麼識別代碼的?

電流可以從A端流向C端,但反過來則不行。你可以把它理解成一種防止電流逆流的東西。

當C端10V,A端0V,二極管可以視為斷開。

當C端0V,A端10V,二極管可以視為導線,結果就是A端的電流源源不斷的流向C端,導致最後的結果就是A端=C端=10V

CPU 到底是怎麼識別代碼的?

等等,不是說好的C端0V,A端10V麼?咋就變成結果是A端=C端=10V了?你可以把這個理解成初始狀態,當最後穩定下來之後就會變成A端=C端=10V。

文科的童鞋們對不住了,實在不懂問高中物理老師吧。反正你不能理解的話就記住這種情況下它相當於導線就行了。

利用半導體,我們可以製作一些有趣的電路,比如【與門】

CPU 到底是怎麼識別代碼的?

此時A端B端只要有一個是0V,那Y端就會和0V地方直接導通,導致Y端也變成0V。只有AB兩端都是10V,Y和AB之間才沒有電流流動,Y端也才是10V。

我們把這個裝置成為【與門】,把有電壓的地方計為1,0電壓的地方計為0。至於具體幾V電壓,那不重要。

也就是AB必須同時輸入1,輸出端Y才是1;AB有一個是0,輸出端Y就是0。

其他還有【或門】【非門】和【異或門】,跟這個都差不多,或門就是輸入有一個是1輸出就是1,輸入00則輸入0。

非門也好理解,就是輸入1輸出0,輸入0輸出1。

異或門難理解一些,不過也就那麼回事,輸入01或者10則輸出1,輸入00或者11則輸出0。(即輸入兩個一樣的值則輸出0,輸入兩個不一樣的值則輸出1)。

這幾種門都可以用二極管做出來,具體怎麼做就不演示了,有興趣的童鞋可以自己試試。每次都畫二極管也是個麻煩,我們就把門電路簡化成下面幾個符號。

CPU 到底是怎麼識別代碼的?

然後我們就可以用門電路來做CPU了。當然做CPU還是挺難的,我們先從簡單的開始:加法器。

加法器顧名思義,就是一種用來算加法的電路,最簡單的就是下面這種。

CPU 到底是怎麼識別代碼的?

AB只能輸入0或者1,也就是這個加法器能算0+0,1+0或者1+1。

輸出端S是結果,而C則代表是不是發生進位了,二進制1+1=10嘛。這個時候C=1,S=0

費了大半天的力氣,算個1+1是不是特別有成就感?

那再進一步算個1+2吧(二進制01+10),然後我們就發現了一個新的問題:第二位需要處理第一位有可能進位的問題,所以我們還得設計一個全加法器。

CPU 到底是怎麼識別代碼的?

每次都這麼畫實在太麻煩了,我們簡化一下

CPU 到底是怎麼識別代碼的?

也就是有3個輸入2個輸出,分別輸入要相加的兩個數和上一位的進位,然後輸入結果和是否進位。

然後我們把這個全加法器串起來

CPU 到底是怎麼識別代碼的?

我們就有了一個4位加法器,可以計算4位數的加法也就是15+15,已經達到了幼兒園中班水平,是不是特別給力?

做完加法器我們再做個乘法器吧,當然乘任意10進制數是有點麻煩的,我們先做個乘2的吧。

乘2就很簡單了,對於一個2進制數數我們在後面加個0就算是乘2了

比如:


5=101(2)

10=1010(2)

所以我們只要把輸入都往前移動一位,再在最低位上補個零就算是乘2了。具體邏輯電路圖我就不畫,你們知道咋回事就行了。

那乘3呢?簡單,先位移一次(乘2)再加一次。乘5呢?先位移兩次(乘4)再加一次。

所以一般簡單的CPU是沒有乘法的,而乘法則是通過位移和加算的組合來通過軟件來實現的。這說的有點遠了,我們還是繼續做CPU吧。

現在假設你有8位加法器了,也有一個位移1位的模塊了。串起來你就能算了!


(A+B)X2

激動人心,已經差不多到了準小學生水平。

那我要是想算呢?


AX2+B

簡單,你把加法器模塊和位移模塊的接線改一下就行了,改成輸入A先過位移模塊,再進加法器就可以了。

啥????你說啥???你的意思是我改個程序還得重新接線?

所以你以為呢?編程就是把線來回插啊。

CPU 到底是怎麼識別代碼的?

驚喜不驚喜?意外不意外?

早期的計算機就是這樣編程的,幾分鐘就算完了但插線好幾天。而且插線是個細緻且需要耐心的工作,所以那個時候的程序員都是清一色的漂亮女孩子,穿制服的那種,就像照片上這樣。是不是有種生不逢時的感覺?

雖然和美女作伴是個快樂的事,但插線也是個累死人的工作。所以我們需要改進一下,讓CPU可以根據指令來相加或者乘2。

這裡再引入兩個模塊,一個叫flip-flop,簡稱FF,中文好像叫觸發器。


CPU 到底是怎麼識別代碼的?

這個模塊的作用是存儲1bit數據。比如上面這個RS型的FF,R是Reset,輸入1則清零。S是Set,輸入1則保存1。RS都輸入0的時候,會一直輸出剛才保存的內容。

我們用FF來保存計算的中間數據(也可以是中間狀態或者別的什麼),1bit肯定是不夠的,不過我們可以並聯嘛,用4個或者8個來保存4位或者8位數據。這種我們稱之為寄存器(Register)。

另外一個叫MUX,中文叫選擇器。

CPU 到底是怎麼識別代碼的?

這個就簡單了,sel輸入0則輸出i0的數據,i0是什麼就輸出什麼,01皆可。同理sel如果輸入1則輸出i1的數據。當然選擇器可以做的很長,比如這種四進一出的


CPU 到底是怎麼識別代碼的?

具體原理不細說了,其實看看邏輯圖琢磨一下就懂了,知道有這個東西就行了。

有這個東西我們就可以給加法器和乘2模塊(位移)設計一個激活針腳。

這個激活針腳輸入1則激活這個模塊,輸入0則不激活。這樣我們就可以控制數據是流入加法器還是位移模塊了。

於是我們給CPU先設計8個輸入針腳,4位指令,4位數據。

我們再設計3個指令:


0100,數據讀入寄存器

0001,數據與寄存器相加,結果保存到寄存器

0010,寄存器數據向左位移一位(乘2)

為什麼這麼設計呢,剛才也說了,我們可以為每個模塊設計一個激活針腳。然後我們可以分別用指令輸入的第二第三第四個針腳連接寄存器,加法器和位移器的激活針腳。

這樣我們輸入0100這個指令的時候,寄存器輸入被激活,其他模塊都是0沒有激活,數據就存入寄存器了。同理,如果我們輸入0001這個指令,則加法器開始工作,我們就可以執行相加這個操作了。

這裡就可以簡單回答這個問題的第一個小問題了:

那cpu 是為什麼能看懂這些二級制的數呢?

為什麼CPU能看懂,因為CPU裡面的線就是這麼接的唄。你輸入一個二進制數,就像開關一樣激活CPU裡面若干個指定的模塊以及改變這些模塊的連同方式,最終得出結果。

幾個可能會被問道的問題

Q:CPU裡面可能有成千上萬個小模塊,一個32位/64位的指令能控制那麼多嗎?

A:我們舉例子的CPU裡面只有3個模塊,就直接接了。真正的CPU裡會有一個解碼器(decoder),把指令翻譯成需要的形式。

Q:你舉例子的簡單CPU,如果我輸入指令0011會怎麼樣?

A:當然是同時激活了加法器和位移器從而產生不可預料的後果,簡單的說因為你使用了沒有設計的指令,所以後果自負唄。(在真正的CPU上這麼幹大概率就是崩潰唄,當然肯定會有各種保護性的設計,死也就死當前進程)

細心的小夥伴可能發現一個問題:你設計的指令


【0001,數據與寄存器相加,結果保存到寄存器】

這個一步做不出來吧?畢竟還有一個回寫的過程,實際上確實是這樣。我們設計的簡易CPU執行一個指令差不多得三步,讀取指令,執行指令,寫寄存器。

經典的RISC設計則是分5步:讀取指令(IF),解碼指令(ID),執行指令(EX),內存操作(MEM),寫寄存器(WB)。我們平常用的x86的CPU有的指令可能要分將近20個步驟。

你可以理解有這麼一個開關,我們啪的按一下,CPU就走一步,你按的越快CPU就走的越快。咦?聽說你有個想法?少年,你這個想法很危險啊,姑且不說你有沒有麒麟臂,能不能按那麼快(現代的CPU也就2GHz多,大概也就一秒按個20億下左右吧)

就算你能按那麼快,雖然速度是上去了,但功耗會大大增加,發熱上升穩定性下降。江湖上確實有這種玩法,名曰超頻,不過新手不推薦你嘗試哈。

那CPU怎麼知道自己走到哪一步了呢?前面不是介紹了FF麼,這個不光可以用來存中間數據,也可以用來存中間狀態,也就是走到哪了。

具體的設計涉及到FSM(finite-state machine),也就是有限狀態機理論,以及怎麼用FF實裝。這個也是很重要的一塊,考試必考哈,只不過跟題目關係不大,這裡就不展開講了。

我們再繼續剛才的講,現在我們有3個指令了。我們來試試算個(1+4)X2+3吧。


0100 0001 ;寄存器存入1

0001 0100 ;寄存器的數字加4

0010 0000 ;乘2

0001 0011 ;再加三

太棒了,靠這臺計算機我們應該可以打敗所有的幼兒園小朋友,稱霸大班了。而且現在我們用的是4位的,如果換成8位的CPU完全可以吊打低年級小學生了!

實際上用程序控制CPU是個挺高級的想法,再此之前計算機(器)的CPU都是單獨設計的。

1969年一家日本公司BUSICOM想搞程控的計算器,而負責設計CPU的美國公司也覺得每次都重新設計CPU是個挺傻X的事,於是雙方一拍即合,於1970年推出一種劃時代的產品,世界上第一款微處理器4004。

這個架構改變了世界,那家負責設計CPU的美國公司也一步一步成為了業界巨頭。哦對了,它叫Intel,對,就是噔噔噔噔的那個。

我們把剛才的程序整理一下,


01000001000101000010000000010011

你來把它輸入CPU,我去準備一下去幼兒園大班踢館的工作。

神馬?等我們輸完了人家小朋友掰手指都能算出來了??

沒辦法機器語言就是這麼反人類。哦,忘記說了,這種只有01組成的語言被稱之為機器語言(機器碼),是CPU唯一可以理解的語言。不過你把機器語言讓人讀,絕對一秒變典韋,這誰也受不了。


分享到:


相關文章: