圖解|為什麼Python多線程無法利用多核

來源:微信公眾號:後端技術指南針

出處:https://mp.weixin.qq.com/s?__biz=MzI1MzYzMTI2Ng==&mid=2247485445&idx=1&sn=1a0bf223143efd8560933fb112308277

1.全局解釋鎖

如題: Python的多線程為什麼不能利用多核處理器?

全局解釋器鎖(Global Interpreter Lock)是計算機程序設計語言解釋器用於同步線程的一種機制,它使得任何時刻僅有一個線程在執行。

即便在多核處理器上,使用 GIL 的解釋器也只允許同一時間執行一個線程,常見的使用 GIL 的解釋器有CPython與Ruby MRI。

可以看到GIL並不是Python獨有的特性,是解釋型語言處理多線程問題的一種機制而非語言特性。

2.Python的解釋器

Python是一門解釋器語言,代碼通過解釋器執行,Python存在多種解釋器,分別基於不同語言開發,每個解釋器有不同的特點。

Python程序的解釋和執行過程簡圖:

圖解|為什麼Python多線程無法利用多核

  • CPython

CPython是主流版本的解釋器,這個解釋器是使用C語言編寫的,也是使用最為廣泛的解釋器,可以方便地和C/C++的類庫進行交互,因此也是最受關注的解釋器。

  • Jython

一種由java語言編寫的python解釋器,是將python編譯成Java字節碼然後執行的一種解釋器,可以方便地和Java的類庫進行交互。

  • IronPython

將Python代碼解釋為.Net平臺上運行的字節碼進行執行,類似Jython解釋器,可以方便的和.Net平臺上的類庫進行交互。IPython

在交互效果上有所增強,但執行過程和功能方面和CPython是一樣的。

  • PyPy

一種使用JIT(just-in-time)技術的編譯器,專注於執行速度,對Python代碼進行動態編譯,從而提高Python的執行速度。

PyPy在處理python代碼的過程中,一小部分功能的處理和CPython的執行結果是有差異的,如果項目中要使用PyPy來進行執行效率的提升的話,一定要事先了解下PyPy和CPython的區別。

3.CPython的線程不安全

CPython的線程是操作系統的原生線程,在Linux的pthread完全由操作系統調度執行。

pthread本身不是線程安全的,需要使用者通過鎖來實現多線程的安全運行,因此CPython解釋器下的Python實現多線程也必然存在線程不安全的問題。

這就為GIL在多核時代的使用埋下了隱患。

4.GIL產生背景和挑戰

Python是Guido van Rossum 在1989年發佈的,那個時候計算機的主頻還沒有達到1G,程序全部都是運行在單核計算機上面,直到2005年多核處理器才被Intel開發出來。

Python各版本發佈時間軸:

圖解|為什麼Python多線程無法利用多核

4.1 多核化對軟件系統的衝擊

戈登·摩爾 1965 年預測,每個集成電路的元件數量每 18 到 24 個月就會翻一倍,它的適用性預計會持續到 2015-2020 年。

圖解|為什麼Python多線程無法利用多核

摩爾定律未失效前軟件系統可以單純藉助硬件的進步來獲得性能的提升或者只需少量改進,就可以坐享性能飛躍。

然而從 2005 年開始,時鐘速率的增長和晶體管數量的增長已不再同步。

由於處理器材料的物理性質限制,時鐘速率已停止增長甚至下降,處理器製造商開始將更多執行單元核心封裝到單個芯片中。

這一趨勢給應用程序開發和編程語言設計帶來越來越大的壓力。

程序員和編程語言決策者不得不考慮如何快速適應多核硬件,來提高軟件性能和編程語言的市場佔有率,Python也不例外受到衝擊。

4.2 多核化對CPython的衝擊

在單核時代,崇尚優美、清晰、簡單的吉多.範羅蘇姆選擇在解釋器層面實現了一把全局互斥鎖,來保護Python對象從而實現對單核CPU的使用率,這種做法在單核時代很奏效。

倘若在單核時未選擇GIL,那麼開發者就需要自己實現任務的管理,這樣做對於CPU的利用率提高無法做到極致。

圖為Python之父吉多.範羅蘇姆:

圖解|為什麼Python多線程無法利用多核

但是隨著多核時代的到來,高效地利用CPU 核心的有效方法就是使用並行性,多線程是充分實現並行的好方法,但是CPython的GIL卻阻礙了對多核CPU的利用。

4.3 痛並快樂著的GIL

CPython的GIL給使用者帶來了便利,並且在GIL的基礎上開發了許多重要的Package和語言功能。

但是多核CPU的普適和其他語言對Python的衝擊,讓GIL顯得原始而粗暴,無法有效利用多核處理器成為了弊端。

5.多核時代GIL暴露的問題

要搞清楚GIL對多線程程序的影響就要了解GIL的運行基本原理。

  • 單核CPU情況

CPython的Pthread是通過操作系統調度算法調度執行。

Python解釋器每執行一定數量的字節碼,或遇到系統IO時,會強制釋放GIL,然後觸發一次操作系統的線程調度,實現單核CPU的充分利用,並且在單核上釋放和重新執行的時間間隔非常短。

  • 多核CPU情況

多核情況下多線程執行時,一個線程在CPU-A執行完之後釋放GIL,其他CPU上的線程都會進行競爭,但CPU-A可能又馬上獲取到了GIL。

這就導致其他CPU上被喚醒的線程只能眼巴巴地看著CPU-A上的線程再次執行,而自己只能等待,直到又被切換到待調度的狀態。

這就會產生多核CPU頻繁進行線程切換,消耗著資源,但只有一個線程能夠拿到GIL真正執行Python代碼,這就導致多線程在多核CPU情況下,效率還不如單線程執行效率高。

這種情況非常類似於網絡編程中的多個線程監聽同一端口造成的驚群現象,只不過是CPU級別的,造成的浪費更加奢侈。

6.GIL的實際影響

  • I/O密集型

在單核CPU上執行多線程時由解釋器實現了有效的切換,這一點是很有益處的。

在I/O密集型的諸如網絡爬蟲等類型的程序即使使用GIL控制下的多線程程序性能也不會像你想象中那麼糟糕。

  • CPU密集型

對於CPU密集型的計算類程序GIL就有比較大的問題,因為CPU密集型的程序本身沒有太多等待,不需要解釋器介入並且所有任務只能等待1個核心,其他核心空閒也無法使用,這麼看對多核的使用確實很糟糕。

7.拋棄和優化GIL

GIL一直備受爭議,為此PEP也多次嘗試刪除或者優化GIL,但是解釋器本身的複雜性和眾多GIL下的類庫都讓GIL移除成為遙不可及的想法。

  • 移除GIL

在1999年針對Python 1.5,一個free threading補丁已經嘗試實現了這個想法,該補丁來自Greg Stein。

在這個補丁中,GIL被完全的移除,且用細粒度的鎖來代替。然而,GIL的移除給單線程程序的執行速度帶來了一定的代價。

當用單線程執行時,速度大約降低了40%。使用兩個線程展示出了在速度上的提高,但除了這個提高,這個收益並沒有隨著核數的增加而線性增長。由於執行速度的降低,這一補丁被拒絕了,並且幾乎被人遺忘。

1999年多核還是個幻想,但是在現今移除GIL也異常困難,真的移除效果如何也是未知的,只能說回頭太難。

  • 優化GIL

2009年Antoine Pitrou 在Python 3.2中實現了一個新的GIL,並且帶著一些積極的結果。

這是GIL的一次最主要改變,舊的GIL通過對Python指令進行計數來確定何時放棄GIL。

單條Python指令將會包含大量的工作,在新的GIL實現中,用一個固定的超時時間來指示當前的線程以放棄這個鎖,使得線程間的切換更加可預測。

8.GIL缺陷的解決方案

python作為生命力極強的熱門語言,絕對不會在多核時代坐以待斃。即便有GIL的限制,仍然有許多方法讓程序擁抱多核。

  • 多進程

Python2.6引入了MultiProcess庫來彌補Threading庫中GIL帶來的缺陷,基於此開發多進程程序,每個進程有單獨的GIL,避免多進程之間對GIL的競爭,從而實現多核的利用,但是也帶來一些同步和通信問題,這也是必然會出現的。

  • Ctypes

CPython的優勢就是與C模塊的結合,因此可以藉助Ctypes調用C的動態庫來實現將計算轉移,C動態庫沒有GIL可以實現對多核的利用。

  • 協程

協程也是一個很好的手段,在Python3.4之前沒有對協程的支持,存在一些三方庫的實現,比如gevent和Tornado。

Python3.4之後就內置了asyncio標準庫真正實現了協程這一特性。

9.小結

GIL仍然是Python語言裡最困難的技術挑戰,GIL問題的並不是編程語言的本身問題,換做其他語言只是將問題轉移到了用戶層面,相反Python的作者嘗試將這種問題轉移到解釋器給使用者呈現一個優雅的語言。

雖然多核時代的到來暴露了GIL的缺陷,但是Python決策者和社區開發者已經做出了許多其他措施來擁抱多核,無知地詬病GIL是不明智的做法。

如同生產關係要適應生產力的發展一樣,拋開歷史背景談機制的優劣,都是有失偏頗的,所以對待GIL要辯證看待。

來源:微信公眾號:後端技術指南針

出處:https://mp.weixin.qq.com/s?__biz=MzI1MzYzMTI2Ng==&mid=2247485445&idx=1&sn=1a0bf223143efd8560933fb112308277


分享到:


相關文章: