Python隱藏特性:字符串駐留、常量摺疊

Python隱藏特性:字符串駐留、常量摺疊

下面是Python字符串的一些微妙的特性,絕對會讓你大吃一驚。

案例一:

Python隱藏特性:字符串駐留、常量摺疊

案例二:

Python隱藏特性:字符串駐留、常量摺疊

案例三:

Python隱藏特性:字符串駐留、常量摺疊


很好理解, 對吧?

說明:

  • 這些行為是由於 Cpython 在編譯優化時, 某些情況下會嘗試使用已經存在的不可變對象而不是每次都創建一個新對象. (這種行為被稱作字符串的駐留[string interning])
  • 發生駐留之後, 許多變量可能指向內存中的相同字符串對象. (從而節省內存)
  • 在上面的代碼中, 字符串是隱式駐留的. 何時發生隱式駐留則取決於具體的實現. 這裡有一些方法可以用來猜測字符串是否會被駐留:
  • 所有長度為 0 和長度為 1 的字符串都被駐留.
  • 字符串在編譯時被實現 ('wtf' 將被駐留, 但是 ''.join(['w', 't', 'f']) 將不會被駐留)
  • 字符串中只包含字母,數字或下劃線時將會駐留. 所以 'wtf!' 由於包含 ! 而未被駐留. 可以在【地址1】找到 CPython 對此規則的實現.
  • 當在同一行將 a 和 b 的值設置為 "wtf!" 的時候, Python 解釋器會創建一個新對象, 然後同時引用第二個變量(譯: 僅適用於3.7以下, 詳細情況請看【地址2】). 如果你在不同的行上進行賦值操作, 它就不會“知道”已經有一個 wtf!對象 (因為 "wtf!" 不是按照上面提到的方式被隱式駐留的). 它是一種編譯器優化, 特別適用於交互式環境.
  • 常量摺疊(constant folding) 是 Python 中的一種 窺孔優化(peephole optimization) 技術. 這意味著在編譯時表達式 'a'*20會被替換為 'aaaaaaaaaaaaaaaaaaaa' 以減少運行時的時鐘週期. 只有長度小於 20 的字符串才會發生常量摺疊. (為啥? 想象一下由於表達式 'a'*10**10 而生成的 .pyc 文件的大小). 相關的源碼實現在【地址3】.
  • 如果你是使用 3.7 版本中運行上述示例代碼, 會發現部分代碼的運行結果與註釋說明相同. 這是因為在 3.7 版本中, 常量摺疊已經從窺孔優化器遷移至新的 AST 優化器, 後者可以以更高的一致性來執行優化. (由 Eugene Toder 和 INADA Naoki 在 bpo-29469 和 bpo-11549 中貢獻.)
  • (譯: 但是在最新的 3.8 版本中, 結果又變回去了. 雖然 3.8 版本和 3.7 版本一樣, 都是使用 AST 優化器. 目前不確定官方對 3.8 版本的 AST 做了什麼調整.)


分享到:


相關文章: