Python乾貨（二）：27個問題，告訴你 Python 為什麼如此設計？

2019-10-29 16:16:04 千鋒python學院

15. 為什麼 CPython 不使用更傳統的垃圾回收方案？

首先，這不是 C 標準特性，因此不能移植。(是的，我們知道 Boehm GC 庫。它包含了 大多數 常見平臺（但不是所有平臺）的彙編代碼，儘管它基本上是透明的，但也不是完全透明的; 要讓 Python 使用它，需要使用補丁。)

當 Python 嵌入到其他應用程序中時，傳統的 GC 也成為一個問題。在獨立的 Python 中，可以用 GC 庫提供的版本替換標準的 malloc()和 free()，嵌入 Python 的應用程序可能希望用 它自己 替代 malloc()和 free()，而可能不需要 Python 的。現在，CPython 可以正確地實現 malloc()和 free()。

16. CPython 退出時為什麼不釋放所有內存？

當 Python 退出時，從全局命名空間或 Python 模塊引用的對象並不總是被釋放。如果存在循環引用，則可能發生這種情況 C 庫分配的某些內存也是不可能釋放的（例如像 Purify 這樣的工具會抱怨這些內容）。但是，Python 在退出時清理內存並嘗試銷燬每個對象。

如果要強制 Python 在釋放時刪除某些內容，請使用 atexit 模塊運行一個函數，強制刪除這些內容。

17. 為什麼有單獨的元組和列表數據類型？

雖然列表和元組在許多方面是相似的，但它們的使用方式通常是完全不同的。可以認為元組類似於 Pascal 記錄或 C 結構；它們是相關數據的小集合，可以是不同類型的數據，可以作為一個組進行操作。例如，笛卡爾座標適當地表示為兩個或三個數字的元組。

另一方面，列表更像其他語言中的數組。它們傾向於持有不同數量的對象，所有對象都具有相同的類型，並且逐個操作。例如， os.listdir('.') 返回表示當前目錄中的文件的字符串列表。如果向目錄中添加了一兩個文件，對此輸出進行操作的函數通常不會中斷。

元組是不可變的，這意味著一旦創建了元組，就不能用新值替換它的任何元素。列表是可變的，這意味著您始終可以更改列表的元素。只有不變元素可以用作字典的 key，因此只能將元組和非列表用作 key。

18. 列表如何在 CPython 中實現？

CPython 的列表實際上是可變長度的數組，而不是 lisp 風格的鏈表。該實現使用對其他對象的引用的連續數組，並在列表頭結構中保留指向該數組和數組長度的指針。

這使得索引列表 a[i] 的操作成本與列表的大小或索引的值無關。

當添加或插入項時，將調整引用數組的大小。並採用了一些巧妙的方法來提高重複添加項的性能; 當數組必須增長時，會分配一些額外的空間，以便在接下來的幾次中不需要實際調整大小。

19. 字典如何在 CPython 中實現？

CPython 的字典實現為可調整大小的哈希表。與 B-樹相比，這在大多數情況下為查找（目前最常見的操作）提供了更好的性能，並且實現更簡單。

字典的工作方式是使用 hash() 內置函數計算字典中存儲的每個鍵的 hash 代碼。hash 代碼根據鍵和每個進程的種子而變化很大；例如，"Python" 的 hash 值為-539294296，而"python"(一個按位不同的字符串)的 hash 值為 1142331976。然後，hash 代碼用於計算內部數組中將存儲該值的位置。假設您存儲的鍵都具有不同的 hash 值，這意味著字典需要恆定的時間 -- O(1)，用 Big-O 表示法 -- 來檢索一個鍵。

20. 為什麼字典 key 必須是不可變的？

字典的哈希表實現使用從鍵值計算的哈希值來查找鍵。如果鍵是可變對象，則其值可能會發生變化，因此其哈希值也會發生變化。但是，由於無論誰更改鍵對象都無法判斷它是否被用作字典鍵值，因此無法在字典中修改條目。然後，當你嘗試在字典中查找相同的對象時，將無法找到它，因為其哈希值不同。如果你嘗試查找舊值，也不會找到它，因為在該哈希表中找到的對象的值會有所不同。

如果你想要一個用列表索引的字典，只需先將列表轉換為元組；用函數 tuple(L)創建一個元組，其條目與列表 L相同。元組是不可變的，因此可以用作字典鍵。

已經提出的一些不可接受的解決方案：

哈希按其地址（對象 ID）列出。這不起作用，因為如果你構造一個具有相同值的新列表，它將無法找到；例如:

mydict = {[1, 2]: '12'}
print(mydict[[1, 2]])

會引發一個 KeyError 異常，因為第二行中使用的 [1, 2] 的 id 與第一行中的 id 不同。換句話說，應該使用 == 來比較字典鍵，而不是使用is 。
使用列表作為鍵時進行復制。這沒有用的，因為作為可變對象的列表可以包含對自身的引用，然後複製代碼將進入無限循環。
允許列表作為鍵，但告訴用戶不要修改它們。當你意外忘記或修改列表時，這將產生程序中的一類難以跟蹤的錯誤。它還使一個重要的字典不變量無效：d.keys() 中的每個值都可用作字典的鍵。
將列表用作字典鍵後，應標記為其只讀。問題是，它不僅僅是可以改變其值的頂級對象；你可以使用包含列表作為鍵的元組。將任何內容作為鍵關聯到字典中都需要將從那裡可到達的所有對象標記為只讀 —— 並且自引用對象可能會導致無限循環。

如果需要，可以使用以下方法來解決這個問題，但使用它需要你自擔風險：你可以將一個可變結構包裝在一個類實例中，該實例同時具有 __eq__() 和 __hash__() 方法。然後，你必須確保駐留在字典（或其他基於 hash 的結構）中的所有此類包裝器對象的哈希值在對象位於字典（或其他結構）中時保持固定。

class ListWrapper:
 def __init__(self, the_list):
 self.the_list = the_list
 def __eq__(self, other):
 return self.the_list == other.the_list
 def __hash__(self):
 l = self.the_list
 result = 98767 - len(l)*555
 for i, el in enumerate(l):
 try:
 result = result + (hash(el) % 9999999) * 1001 + i
 except Exception:
 result = (result % 7777777) + i * 333
 return result

注意，哈希計算由於列表的某些成員可能不可用以及算術溢出的可能性而變得複雜。

此外，必須始終如此，如果 o1 == o2 （即 o1.__eq__(o2) is True ）則 hash(o1) == hash(o2)``（即``o1.__hash__() == o2.__hash__() ），無論對象是否在字典中。如果你不能滿足這些限制，字典和其他基於 hash 的結構將會出錯。

對於 ListWrapper ，只要包裝器對象在字典中，包裝列表就不能更改以避免異常。除非你準備好認真考慮需求以及不正確地滿足這些需求的後果，否則不要這樣做。請留意。

21. 為什麼 list.sort() 沒有返回排序列表？

在性能很重要的情況下，僅僅為了排序而複製一份列表將是一種浪費。因此， list.sort() 對列表進行了適當的排序。為了提醒您這一事實，它不會返回已排序的列表。這樣，當您需要排序的副本，但也需要保留未排序的版本時，就不會意外地覆蓋列表。

如果要返回新列表，請使用內置 sorted() 函數。此函數從提供的可迭代列表中創建新列表，對其進行排序並返回。例如，下面是如何迭代遍歷字典並按 keys 排序:

for key in sorted(mydict):
 ... # do whatever with mydict[key]...

22. 如何在 Python 中指定和實施接口規範？

由 C++和 Java 等語言提供的模塊接口規範描述了模塊的方法和函數的原型。許多人認為接口規範的編譯時強制執行有助於構建大型程序。

Python 2.6 添加了一個 abc 模塊，允許定義抽象基類 (ABCs)。然後可以使用isinstance() 和 issubclass() 來檢查實例或類是否實現了特定的 ABC。collections.abc 模塊定義了一組有用的 ABCs 例如 Iterable ， Container , 和 MutableMapping

對於 Python，通過對組件進行適當的測試規程，可以獲得接口規範的許多好處。還有一個工具 PyChecker，可用於查找由於子類化引起的問題。

一個好的模塊測試套件既可以提供迴歸測試，也可以作為模塊接口規範和一組示例。許多 Python 模塊可以作為腳本運行，以提供簡單的“自我測試”。即使是使用複雜外部接口的模塊，也常常可以使用外部接口的簡單“樁代碼（stub）”模擬進行隔離測試。可以使用 doctest 和 unittest 模塊或第三方測試框架來構造詳盡的測試套件，以運行模塊中的每一行代碼。

適當的測試規程可以幫助在 Python 中構建大型的、複雜的應用程序以及接口規範。事實上，它可能會更好，因為接口規範不能測試程序的某些屬性。例如，append() 方法將向一些內部列表的末尾添加新元素；接口規範不能測試您的 append() 實現是否能夠正確執行此操作，但是在測試套件中檢查這個屬性是很簡單的。

編寫測試套件非常有用，您可能希望設計代碼時著眼於使其易於測試。一種日益流行的技術是面向測試的開發，它要求在編寫任何實際代碼之前，首先編寫測試套件的各個部分。當然，Python 允許您草率行事，根本不編寫測試用例。

23. 為什麼沒有 goto？

可以使用異常捕獲來提供 “goto 結構” ，甚至可以跨函數調用工作的。許多人認為異常捕獲可以方便地模擬 C，Fortran 和其他語言的 "go" 或 "goto" 結構的所有合理用法。例如:

class label(Exception): pass # declare a label
try:
 ...
 if condition: raise label() # goto label
 ...
except label: # where to goto
 pass
...

但是不允許你跳到循環的中間，這通常被認為是濫用 goto。謹慎使用。

24. 為什麼原始字符串（r-strings）不能以反斜槓結尾？

更準確地說，它們不能以奇數個反斜槓結束：結尾處的不成對反斜槓會轉義結束引號字符，留下未結束的字符串。

原始字符串的設計是為了方便想要執行自己的反斜槓轉義處理的處理器(主要是正則表達式引擎)創建輸入。此類處理器將不匹配的尾隨反斜槓視為錯誤，因此原始字符串不允許這樣做。反過來，允許通過使用引號字符轉義反斜槓轉義字符串。當 r-string 用於它們的預期目的時，這些規則工作的很好。

如果您正在嘗試構建 Windows 路徑名，請注意所有 Windows 系統調用都使用正斜槓:

f = open("/mydir/file.txt") # works fine!

如果您正在嘗試為 DOS 命令構建路徑名，請嘗試以下示例

dir = r"\\this\\is\\my\\dos\\dir" "\\\\"
dir = r"\\this\\is\\my\\dos\\dir\\ "[:-1]
dir = "\\\\this\\\\is\\\\my\\\\dos\\\\dir\\\\"

25. 為什麼 Python 沒有屬性賦值的“with”語句？

Python 有一個 'with' 語句，它封裝了塊的執行，在塊的入口和出口調用代碼。有些語言的結構是這樣的:

with obj:
 a = 1 # equivalent to obj.a = 1
 total = total + 1 # obj.total = obj.total + 1

在 Python 中，這樣的結構是不明確的。

其他語言，如 ObjectPascal、Delphi 和 C++ 使用靜態類型，因此可以毫不含糊地知道分配給什麼成員。這是靜態類型的要點 -- 編譯器總是在編譯時知道每個變量的作用域。

Python 使用動態類型。事先不可能知道在運行時引用哪個屬性。可以動態地在對象中添加或刪除成員屬性。這使得無法通過簡單的閱讀就知道引用的是什麼屬性：局部屬性、全局屬性還是成員屬性？

例如，採用以下不完整的代碼段:

def foo(a):
 with a:
 print(x)

該代碼段假設 "a" 必須有一個名為 "x" 的成員屬性。然而，Python 中並沒有告訴解釋器這一點。假設 "a" 是整數，會發生什麼？如果有一個名為 "x" 的全局變量，它是否會在 with 塊中使用？如您所見，Python 的動態特性使得這樣的選擇更加困難。

然而，Python 可以通過賦值輕鬆實現 "with" 和類似語言特性（減少代碼量）的主要好處。代替:

function(args).mydict[index][index].a = 21
function(args).mydict[index][index].b = 42
function(args).mydict[index][index].c = 63

寫成這樣:

ref = function(args).mydict[index][index]
ref.a = 21
ref.b = 42
ref.c = 63

這也具有提高執行速度的副作用，因為 Python 在運行時解析名稱綁定，而第二個版本只需要執行一次解析。

26. 為什麼 if/while/def/class 語句需要冒號？

冒號主要用於增強可讀性(ABC 語言實驗的結果之一)。考慮一下這個:

if a == b
 print(a)

與

if a == b:
 print(a)

注意第二種方法稍微容易一些。請進一步注意，在這個 FAQ 解答的示例中，冒號是如何設置的；這是英語中的標準用法。

另一個次要原因是冒號使帶有語法突出顯示的編輯器更容易工作；他們可以尋找冒號來決定何時需要增加縮進，而不必對程序文本進行更精細的解析。

27. 為什麼 Python 在列表和元組的末尾允許使用逗號？

Python 允許您在列表，元組和字典的末尾添加一個尾隨逗號:

[1, 2, 3,]
('a', 'b', 'c',)
d = {
 "A": [1, 5],
 "B": [6, 7], # last trailing comma is optional but good style
}

有幾個理由允許這樣做。

如果列表，元組或字典的字面值分佈在多行中，則更容易添加更多元素，因為不必記住在上一行中添加逗號。這些行也可以重新排序，而不會產生語法錯誤。

不小心省略逗號會導致難以診斷的錯誤。例如:

x = [
 "fee",
 "fie"
 "foo",
 "fum"
]

這個列表看起來有四個元素，但實際上包含三個 : "fee", "fiefoo" 和 "fum" 。總是加上逗號可以避免這個錯誤的來源。

允許尾隨逗號也可以使編程代碼更容易生成。

分享到:

閱讀更多 千鋒python學院 的文章

關鍵字: Python 為什麼乾貨

Python 63個內置函數

Python Turtle畫分形樹理解遞歸

python 內存管理

python 遞歸輸出文件

Python 中的

python copy

Python—turtle畫圖（哆啦A夢）

python 協程

Python 繪圖以及文件的基本操作

Python wordcloud庫介紹

python 閉包

Python 判斷列表是否已排好序

python：序列和元組的區別

Python While 循環語句介紹

03.04 Python While 循環語句介紹

03.01 Python 模塊

python 註釋

python pandas數據清洗

Python 中的bool值

python-unittest基本介紹

Python 分發包中添加額外文件

# Python 3 # Python 3字典Dictionary（2）

# Python 3 # Python 3字典Dictionary（1）

# Python 3 # Python 3運算符（4）

# Python 3 # Python 3基本數據類型（3）

12.21 python lambda表達式簡單用法

python :中文大寫轉阿拉伯數字（金額）

python str和bytes的區別

Python 的四種共享傳參詳解

[PYTHON]，字符串的查找，什麼時候能混到給錢不用找零了

說說在 Python 中如何導入類

[PYTHON]，字符串的大小寫，大賭場小賭場大小賭場賭大小

[PYTHON]，字符串的類型判斷，只聽得驚堂木一拍

[PYTHON]，字符串轉義字符，字符串變身

python 音頻處理

python 可變對象和不可變對象

Python 程序運行時間計時

python 字典底層實現原理

06.20 Python 枚舉類型 Enum

06.17 Python Lambda 表達式

06.17 Python 數據類型轉換

06.16 Python 中的包 Packages

06.09 Python 正則表達式斷言 Assertions

06.09 Python 異常處理

python-with語法

05.27 python-with語法

python-as語法

05.27 python-as語法

「python」高階函數map、reduce的介紹

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"