卷積神經網絡CNN的基本結構

卷積神經網絡在AI領域中一種常見的工具,特別是在圖像識別、處理中很常見。與傳統的神經網絡不同,它的每個神經元可以看作包括了卷積、閾值、池化三個步驟。卷積操作用於特徵識別,閾值操作通常是ReLU函數用於特徵的提取,池化層相當於數據的壓縮。

卷積相當於一個特徵識別的過程,每一個特徵就是一個卷積核,比如我要找眉毛就用眉毛和圖片做卷積如果,找鼻子就用鼻子和圖片做卷積,就是先乘後加再除的一串操作。


卷積神經網絡CNN的基本結構

左上角就是卷積核,代表的某種特徵,中間的就是需要識別的圖像,右上角就是卷積的結果,如果找到了特徵那麼算下來的結果值是最大的,所以在卷積後圖像中找到最大值的位置就找到了特徵。當然這個最大值往往是由某個閾值來控制的,這就用到了ReLU函數,超過的閾值的數會被保留下來,這樣圖像就變成了一副準特徵圖了。


卷積神經網絡CNN的基本結構

當然這個函數不是一個階梯函數,需要一個連續函數才能在神經網絡中訓練,所以一般選擇ReLU函數。經過閾值處理以後,圖像中包含了很多沒用的0,所以這時候可以將沒有用的信息去掉,使得圖像只保留特徵的信息便於以後進行處理,這個步驟就是池化pooling。


卷積神經網絡CNN的基本結構

用一個最大2*2矩陣掃描圖像,取每個區域某個特徵,如選區區域中的最大值就是max_pooling,如上圖。經過池化操作,圖像就被壓縮了保留了那些你需要的信息。

CNN本質上是神經網絡,通過每一層的數據處理對象的特徵被提取出來了,然後進入下一層進行進一步的提取直到得到結果。神經網絡的基本結構就包括這幾個基本要素,在其上還有許多的變化,但是萬變不離都離不開他的基本結構。


卷積神經網絡CNN的基本結構


分享到:


相關文章: