柏拉圖,亞里士多德和機器學習

雅典學院是世界上最著名的壁畫之一。這是一幅文藝復興時期的傑作,描繪了古典時代的偉大哲學家,由拉斐爾於1509-1511年間所畫。

柏拉圖,亞里士多德和機器學習

雅典學院,拉斐爾的壁畫,1509-11

雖然在這幅壁畫中有很多值得討論的內容,但我想提請你注意兩個核心人物:柏拉圖指向天空,他的學生亞里士多德指向地球。

柏拉圖,亞里士多德和機器學習

柏拉圖(左)和亞里士多德(右)

但拉斐爾為什麼要這樣描繪他們呢?

柏拉圖認為,我們所生活的世界,物質世界,只是理想世界的陰影。例如,我們在這個世界上看到的蘋果是一個完美蘋果的不完美反映,它存在於理想世界中。柏拉圖稱這些完美或理想的東西是他們的形式,從而形成了他的形式理論。形式理論不僅限於對象,我們還可以談論教育形式,友誼形式等。然而,亞里士多德反對他的老師並聲稱物質世界是真實的。他認為,在物質世界中,形式存在於所討論的事物中。如果沒有蘋果,就沒有蘋果。他們都相信形式,但不同意它們是存在於另一個世界(柏拉圖)還是存在於這個世界(亞里士多德)。

現在你可能會猜到拉斐爾想傳達的信息,柏拉圖指出天空,因為他相信形式在另一個世界,相反亞里士多德指出地球說形式實際上可以在物質世界中找到。

這一討論涉及到形而上學的普遍性問題。普遍性是兩個或兩個以上的實體有共同之處的事物(例如,根據柏拉圖的說法,是一隻貓或一隻理想的貓),而普遍性有被稱為特殊性的實例。加菲貓是一種特殊的貓。他擁有所有貓科動物的共同特徵,還有其他一些不是每隻貓都有的屬性,如懶惰、橙色等。

但是這一切與機器學習有什麼關係呢?在回答這個問題之前,我將嘗試解釋在數據,信號和噪聲方面的機器學習。我們首先澄清這些術語:

  • Data:您觀察或測量的值。
  • Signal:觀察或測量的預期值。
  • Noise:不完美導致預期值和觀察值不同。

基於這些定義,我們可以說Data = Signal + Noise。讓我試著用一個具體的例子來解釋這個概念。

如何描繪物體(m = 2 kg)的力(N)與加速度(m /s²)的關係呢?理想情況下,它應遵循牛頓第二定律,F = m * a。然而,在我們生活的世界裡,我們知道事情並不完美。因此,觀察到的行為將類似於F = m * a +Noise。您可以在下面看到用於生成它們的圖表和Python示例代碼:

m=2 #mass of the object
a=10*np.random.rand(50,1) #50 random acceleration values
F_ideal=m*a #Ideal F
F_observed=m*a+np.random.randn(50,1) #Observed F
柏拉圖,亞里士多德和機器學習

理想與觀察行為

柏拉圖,亞里士多德和機器學習

Data = Signal + Noise

本質上,機器學習算法試圖學習數據內部的信號。重要的是要強調這些算法被賦予數據,但他們不知道數據的哪個部分是Signal,哪個部分是Noise。

例如,讓我們將線性迴歸應用於上面生成的數據。您可以看到擬合幾乎等於信號。機器學習算法不知道我用來生成這些數據的Signal,但它能夠找到非常接近的數據。Python示例代碼

import sklearn
from sklearn import linear_model
model = linear_model.LinearRegression()
model.fit(a, F_observed)
柏拉圖,亞里士多德和機器學習

Fit試圖找到Signal

現在我們可以看到機器學習和普遍性問題之間的對應關係。

  • 機器學習:Data = Signal + Noise
  • 通用問題:我們看到的=通用+特殊屬性

想象一下,你的朋友要求你建造一個孟加拉貓分類器。你收集孟加拉貓圖像(數據)並訓練卷積神經網絡(CNN)來完成這項任務。算法查看數據,將Signal(通用孟加拉貓)與Noise分開(特別是一隻貓有疤痕,另一隻圖像背景有樹等),從而瞭解一隻理想的孟加拉貓應該是什麼樣子。該機器學習算法將其學習的內容存儲為稱為“權重”的參數。換句話說,訓練後卷積神經網絡(CNN)的權重對應於通用孟加拉貓 - Signal。

柏拉圖,亞里士多德和機器學習

孟加拉貓(理想的孟加拉貓)的藍圖由卷積神經網絡(CNN)的權重捕獲。邊緣由第一層捕獲,第二層學習輪廓,第三層學習眼睛,耳朵和尾巴。

最後

這篇文章的關鍵點是機器學習算法的目的是學習數據中的通用(也稱為Forms or signal)。希望這能幫助你從不同的角度看待機器學習中的一些概念,並更容易地理解它們。


分享到:


相關文章: