Python中反人類直覺的特性，你踩過坑嗎？

2020-04-12 17:24:59 Python集結號

Python是一個基於C語言實現的解釋型高級語言, 提供了很多舒適的功能特性，使用起來非常方便。但有的時候, Python的輸出結果，讓我們感覺一頭霧水，其中原因自然是Python語言內部實現導致的，下面我們就給大家總結一些難以理解和反人類直覺的例子。

奇妙的字符串

普通相同字符

<code>a = 'small_tom'
id(a)

# 輸出： 140232182302576/<code>

<code>b = 'small' + '_' + 'tom'
id(b)
# 輸出：140232182302576/<code>

<code>id(a) == id(b)
# 輸出： True/<code>

包含特殊字符

<code>a = 'tom'
b = 'tom'
a is b
# 輸出：True/<code>

<code>a = 'tom!'
b = 'tom!'
a is b
# 輸出：False/<code>

<code>a, b = 'tom!', 'tom!'
a is b
# 輸出：False   Python3.7以下為True/<code>

<code>'a' * 20 is 'aaaaaaaaaaaaaaaaaaaa'
# 輸出：True
'a' * 21 is 'aaaaaaaaaaaaaaaaaaaaa'
# 輸出：True   Python3.7以下為False/<code>

<code>a = 'tom'
b = ''.join(['t', 'o', 'm'])
a is b
# 輸出：/<code>

為什麼會出現以上的現象呢？因為編譯器的優化特性（很多語言的不同編譯器都有相應的優化策略），對於不可變對象，在某些情況下並不會創建新的對象，而是會嘗試使用已存在的對象，從而節省內存，可以稱之為**字符串駐留**。字符串的駐留是隱式的，不受我們控制，但是我們可以根據一些規律來猜測是否發生字符串駐留：

所有長度為 0 和長度為 1 的字符串都被駐留

字符串中只包含字母，數字或下劃線時將會駐留。所以 'tom!' 由於包含 ! 而未被駐留。

'tom'將被駐留，而''.join(['t', 'o', 'm'])不被駐留

當在同一行將 a 和 b 的值設置為 "tom!" 的時候, Python 解釋器會創建一個新對象, 然後同時引用第二個變量(譯: 僅適用於3.7以下). 如果你在不同的行上進行賦值操作, 它就不會“知道”已經有一個 wtf！對象 (因為 "wtf!" 不是按照上面提到的方式被隱式駐留的). 它是一種編譯器優化, 特別適用於交互式環境

當在同一行將 a 和 b 的值設置為 "tom!" 的時候, Python 解釋器會創建一個新對象, 然後同時引用第二個變量(僅適用於3.7以下). 如果你在不同的行上進行賦值操作, 它就不會“知道”已經有一個 tom！對象 (因為 "tom!" 不是按照上面提到的方式被隱式駐留的). 它是一種編譯器優化, 特別適用於交互式環境.

常量摺疊(constant folding) 是 Python 中的一種窺孔優化(peephole optimization) 技術. 這意味著在編譯時表達式 'a'*20 會被替換為 'aaaaaaaaaaaaaaaaaaaa' 以減少運行時的時鐘週期. 只有長度小於 20 的字符串才會發生常量摺疊. 為什麼呢？想象一下由於表達式 'a'*10**10 而生成的.pyc 文件的大小)。

**PS**：如果是在Python3.7中會發現部分執行結果會不一樣，因為3.7版本中常量摺疊已經從窺孔優化器遷移至新的AST優化器，後者可以以更高的一致性來執行優化。但是在3.8中結果又不一樣了，他們都是用了AST優化器，可能是3.8中有一些其他的調整。

字典的魔法

<code>some_dict = {}
some_dict[5.5] = "Ruby"
some_dict[5.0] = "JavaScript"
some_dict[5] = "Python"/<code>

<code>some_dict[5.5]
# 輸出：Ruby
some_dict[5.0]
# 輸出：Python
some_dict[5]
# 輸出：Python/<code>

Python字典通過檢查鍵值是否相等和比較哈希值來確定兩個鍵是否相同
具有相同值的不可變對象在Python中始終具有相同的哈希值

雖然5.0和5好像是不一樣，但實際上是一樣的，在python中是不存在整型和浮點型的，只有一個數值型

<code>5 == 5.0
# 輸出：True
hash(5) == hash(5.0)
# 輸出：True/<code>

注意: 具有不同值的對象也可能具有相同的哈希值（哈希衝突）

當執行 some_dict[5] = "Python" 語句時, 因為Python將5和5.0識別為some_dict 的同一個鍵, 所以已有值 "JavaScript" 就被 "Python" 覆蓋了.

到處都返回

<code>def some_func():
    try:
        return 'from_try'
    finally:
        return 'from_finally'
some_func()
# 始終輸出：from_finally/<code>

這是一個非常嚴重的問題，而且也非常常見，也很長用到，需要格外的注意。在異常捕獲的時候，我們經常會用到finally來執行異常捕獲後必須執行的處理。但是return在很多語言當中表示跳出當前的執行模塊，但是在這裡就有些顛覆我們的認知了，所以必須重點關注。

當在 "try...finally" 語句的 try 中執行 return, break 或 continue 後, finally 子句依然會執行.

函數的返回值由最後執行的 return 語句決定. 由於 finally 子句一定會執行, 所以 finally 子句中的 return 將始終是最後執行的語句

出人意料的is

下面是一個在網上非常有名的例子.

<code>a = 256
b = 256
a is b
# 輸出：True

a = 257
b = 257
a is b
# 輸出：False

a = 257; b = 257
a is b
# 輸出：True

a, b = 257, 257
a is b
# 輸出：True/<code>

1.我們要說一下is和==的區別

is 運算符檢查兩個運算對象是否引用自同一對象 (即, 它檢查兩個運算對象地址是否相同)
==運算符比較兩個運算對象的值是否相等

<code>a = 257
b = 257
a is b
# 輸出：False
a == b
# 輸出：True/<code>

2.為什麼256和257的結果不一樣？

當你啟動Python的時候, 數值為-5到256 的對象就已經被分配好了. 這些數字因為經常被使用, 所以會被提前準備好。Python通過這種創建小整數池的方式來避免小整數頻繁的申請和銷燬內存空間，從而造成內存洩漏和碎片。

3.當a和b在同一行中使用相同的值初始化時，會指向同一個對象.

<code>a, b = 257, 257
id(a)
# 輸出：4391026960
id(b)
# 輸出：4391026960

a = 257 
b = 257
id(a)
# 輸出：140232163575152
id(b)
# 輸出：140232163574768/<code>

當 a 和 b 在同一行中被設置為 257 時, Python 解釋器會創建一個新對象, 然後同時引用第二個變量. 如果你在不同的行上進行, 它就不會 "知道" 已經存在一個 257 對象
必須要注意的是這是一種特別為交互式環境做的編譯器優化. 當你在實時解釋器中輸入兩行的時候, 他們會單獨編譯, 因此也會單獨進行優化. 如果你在 .py 文件中嘗試這個例子, 則不會看到相同的行為, 因為文件是一次性編譯的，如果是運行py文件將得到不同的結果

test.py

<code>a, b = 257, 257
print(id(a))
print(id(b))
# 輸出：
/<code>

列表複製

<code>row = [""]*3
# 並創建一個變量board
board = [row]*3
print(row)
print(board)
# 輸出：['', '', '']
# 輸出：[['', '', ''], ['', '', ''], ['', '', '']]

board[0][0] = 'X'
print(board)
# 輸出：[['X', '', ''], ['X', '', ''], ['X', '', '']]/<code>

當我們初始化 row 變量時, 下面這張圖展示了內存中的情況。

而當通過對 row 做乘法來初始化 board 時, 內存中的情況則如下圖所示 (每個元素 board[0], board[1] 和 board[2] 都和 row 一樣引用了同一列表.)

我們可以通過不使用變量 row 生成 board 來避免這種情況

<code>board = [['']*3 for _ in range(3)]
board[0][0] = "X"
board
# 輸出：[['X', '', ''], ['', '', ''], ['', '', '']]/<code>

這樣就會創建三個[''] * 3，而不是把[''] * 3標記三次

閉包

<code>funcs = []
results = []
for x in range(7):
    def some_func():
        return x
    funcs.append(some_func)
    results.append(some_func()) # 注意這裡函數被執行了

funcs_results = [func() for func in funcs]
print(results)
print(funcs_results)
# 輸出：[0, 1, 2, 3, 4, 5, 6]
# 輸出：[6, 6, 6, 6, 6, 6, 6]/<code>

即使每次在迭代中some_func中的x值都不相同，所有的函數還是都返回6.

<code>powers_of_x = [lambda x: x**i for i in range(10)]
[f(2) for f in powers_of_x]
# 輸出：[512, 512, 512, 512, 512, 512, 512, 512, 512, 512]/<code>

當在循環內部定義一個函數時, 如果該函數在其主體中使用了循環變量, 則閉包函數將與循環變量綁定, 而不是它的值.
因此, 所有的函數都是使用最後分配給變量的值來進行計算的

可以通過將循環變量作為命名變量傳遞給函數來獲得預期的結果. 為什麼這樣可行? 因為這會在函數內再次定義一個局部變量

<code>funcs = []
for x in range(7):
    def some_func(x=x):
        return x
    funcs.append(some_func)
funcs_results = [func() for func in funcs]
print(funcs_results)
# 輸出：[0, 1, 2, 3, 4, 5, 6]/<code>

is not ... 不是 is (not ...)

<code>'something' is not None
# 輸出：True
'something' is (not None)
# 輸出：False/<code>

is not 是個單獨的二元運算符, 與分別使用 is 和 not 不同.

如果操作符兩側的變量指向同一個對象, 則 is not 的結果為 False, 否則結果為 True.

不存在的零點

<code>from datetime import datetime

midnight = datetime(2018, 1, 1, 0, 0)
midnight_time = midnight.time()

noon = datetime(2018, 1, 1, 12, 0)
noon_time = noon.time()
 

if midnight_time:
    print("Time at midnight is", midnight_time)

if noon_time:
    print("Time at noon is", noon_time)
# 輸出：Time at midnight is 00:00:00
# 輸出：Time at noon is 12:00:00/<code>

以上代碼如果是在python3.5之前的版本，只會輸出Time at noon is 12:00:00，在Python 3.5之前, 如果 datetime.time 對象存儲的UTC的午夜時間(譯: 就是 00:00), 那麼它的布爾值會被認為是 False. 當使用 if obj: 語句來檢查 obj 是否為 null 或者某些“空”值的時候, 很容易出錯.

類屬性和實例屬性

<code>class A:
    x = 1

class B(A):
    pass

class C(A):
    pass
print(A.x, B.x, C.x)
# 輸出：1 1 1

B.x = 2
print(A.x, B.x, C.x)
# 輸出：1 2 1

A.x = 3
print(A.x, B.x, C.x)
# 輸出：3 2 3

a = A()
print(a.x, A.x)
# 輸出：3 3

a.x += 1
print(a.x, A.x)
# 輸出：4 3\t/<code>

<code>class SomeClass: 

    some_var = 15
    some_list = [5]
    another_list = [5]
    def __init__(self, x):
        self.some_var = x + 1
        self.some_list = self.some_list + [x]
        self.another_list += [x]

some_obj = SomeClass(420)
print(some_obj.some_list)

print(some_obj.another_list)
another_obj = SomeClass(111)
print(another_obj.some_list)
print(another_obj.another_list)
print(another_obj.another_list is SomeClass.another_list)
print(another_obj.another_list is some_obj.another_list)/<code>

類變量和實例變量在內部是通過類對象的字典來處理. 如果在當前類的字典中找不到的話就去它的父類中尋找

+= 運算符會在原地修改可變對象, 而不是創建新對象. 因此, 在這種情況下, 修改一個實例的屬性會影響其他實例和類屬性.

從有到無

<code>some_list = [1, 2, 3]
some_dict = {
  "key_1": 1,
  "key_2": 2,
  "key_3": 3
}

some_list = some_list.append(4)
some_dict = some_dict.update({"key_4": 4})
print(some_list)
print(some_dict)
# 輸出：None 

# 輸出：None/<code>

不知道有沒有人能一眼看出問題所在，這是一個寫法錯誤，並不是特殊用法。因為列表和字典的操作函數，比如list.append、list.extend、dict.update等都是原地修改變量，不創建也不返還新的變量

子類繼承關係

<code>from collections import Hashable
print(issubclass(list, object))
print(issubclass(object, Hashable))
print(issubclass(list, Hashable))
# 輸出：True
# 輸出：True
# 輸出：False/<code>

子類關係是可以傳遞的，A是B的子類，B是C的子類，那麼A應該也是C的子類，但是在python中就不一定了，因為在python中使用__subclasscheck__函數進行判斷，而任何人都可以定義自己的__subclasscheck__函數

當 issubclass(cls, Hashable) 被調用時, 它只是在 cls 中尋找 __hash__ 方法或者從繼承的父類中尋找 __hash__ 方法.
由於 object is 可散列的(hashable), 但是 list 是不可散列的, 所以它打破了這種傳遞關係

<code>class MyMetaClass(type):
    def __subclasscheck__(cls, subclass):
        print("Whateva, I do what I want!")
        import random
        return random.choice([True, False])

 

class MyClass(metaclass=MyMetaClass):
    pass

print(issubclass(list, MyClass))
# 輸出：Whateva, I do what I want!
# 輸出：True 或者 False    因為是隨機取的/<code>

元類在python中是比較深入的知識點，後面我們有時間再講

斗轉星移

<code>import numpy as np

def energy_send(x):
    # 初始化一個 numpy 數組    
    np.array([float(x)])

def energy_receive():
    # 返回一個空的 numpy 數組    
    return np.empty((), dtype=np.float).tolist()

energy_send(123.456)
print(energy_receive())
# 輸出：123.456/<code>

這到底是無中生有還是斗轉星移呢？energy_receive函數我們返回了一個空的對象，但是結果是上一個數組的值，為什麼呢？

在energy_send函數中創建的numpy數組並沒有返回, 因此內存空間被釋放並可以被重新分配.

numpy.empty()直接返回下一段空閒內存，而不重新初始化. 而這個內存點恰好就是剛剛釋放的那個但是這並不是絕對的.

分享到:

閱讀更多 Python集結號 的文章

關鍵字: C語言中反 Python

Python 63個內置函數

Python Turtle畫分形樹理解遞歸

python 內存管理

python 遞歸輸出文件

Python 中的

python copy

Python—turtle畫圖（哆啦A夢）

python 協程

Python 繪圖以及文件的基本操作

Python wordcloud庫介紹

python 閉包

Python 判斷列表是否已排好序

python：序列和元組的區別

Python While 循環語句介紹

03.04 Python While 循環語句介紹

03.01 Python 模塊

python 註釋

python pandas數據清洗

Python 中的bool值

python-unittest基本介紹

Python 分發包中添加額外文件

# Python 3 # Python 3字典Dictionary（2）

# Python 3 # Python 3字典Dictionary（1）

# Python 3 # Python 3運算符（4）

# Python 3 # Python 3基本數據類型（3）

12.21 python lambda表達式簡單用法

python :中文大寫轉阿拉伯數字（金額）

python str和bytes的區別

Python 的四種共享傳參詳解

[PYTHON]，字符串的查找，什麼時候能混到給錢不用找零了

說說在 Python 中如何導入類

[PYTHON]，字符串的大小寫，大賭場小賭場大小賭場賭大小

[PYTHON]，字符串的類型判斷，只聽得驚堂木一拍

[PYTHON]，字符串轉義字符，字符串變身

python 音頻處理

python 可變對象和不可變對象

Python 程序運行時間計時

python 字典底層實現原理

06.20 Python 枚舉類型 Enum

06.17 Python Lambda 表達式

06.17 Python 數據類型轉換

06.16 Python 中的包 Packages

06.09 Python 正則表達式斷言 Assertions

06.09 Python 異常處理

python-with語法

05.27 python-with語法

python-as語法

05.27 python-as語法

「python」高階函數map、reduce的介紹

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"