一文讀懂深度學習中的卷積運算與圖像處理

一文讀懂深度學習中的卷積運算與圖像處理

華為人工智能認證講師 袁夢

在人工智能深度學習技術中,有一個很重要的概念就是卷積神經網絡 CNN(Convolutional Neural Networks)。卷積神經網絡被廣泛地運用到計算機視覺中,用於提取圖像數據的特徵,其中發揮關鍵作用的步驟就是卷積層中的卷積運算。卷積到底是什麼?深度學習中的卷積運算與傳統的信號與系統中的卷積算子有什麼不同?為什麼卷積運算可以提取圖像的特徵呢?下面一文三分鐘讓你讀懂卷積運算與圖像處理。

瞭解卷積運算

卷積一詞最開始出現在信號與系統中,是指兩個原函數產生一個新的函數的一種算子。卷積運算在運算過程可以概括為翻轉、平移再加權求和三個步驟,其中的加權求和就是乘加操作。另外,卷積運算還有一個重要的特性:空間域卷積=頻域乘積,這一點可以解釋為什麼卷積運算可以自動地提取圖像的特徵。

在卷積神經網絡中,對數字圖像做卷積操作其實就是利用卷積核(黃底部分)在圖像(綠底部分)上滑動,將圖像上的像素灰度值與對應卷積核上的數值相乘,然後將所有相乘後的值相加作為此時的輸出值(紅底部分),並最終滑動遍歷完整副圖像的過程。

一文讀懂深度學習中的卷積運算與圖像處理

動圖來源於:stanford.edu, Feature extraction using convolution

大家仔細觀察上述動圖,圖像中的卷積操作相比於信號與系統中的卷積是不是少了點什麼?我們可以看到,圖像中卷積的計算過程相對於信號與系統中的卷積算子缺少了翻轉這一步,只有平移和乘加兩個步驟。那麼圖像的卷積操作是否需要進行翻轉呢?

事實上,深度學習中卷積核其實無需進行翻轉的,因為卷積核中的所有權重都是隨機初始化,開始是不確定的。網絡每次更新迭代都是為了去尋找一個最合適的卷積核權重值,所以是否翻轉也就無關緊要了;另一個原因是在圖像處理中的卷積核一般是對稱的,翻轉也就顯得不那麼必要。

以上是傳統信號與系統中的卷積算子與卷積神經網絡中的卷積運算的異同點。而卷積神經網絡被廣泛運用到計算機視覺的最大一個原因就是卷積層可以自動地提取圖像特徵。

提取圖像特徵

圖像中的特徵通常指代圖像中物體的輪廓與紋理信息,而通常物體的細節(可以簡單地理解為圖像中像素點灰度值變換緩慢的地方)帶來的信息量較少。我們通常所說的圖像特徵提取的過程是在保留圖像輪廓和紋理的同時,去掉冗餘信息的過程。

一文讀懂深度學習中的卷積運算與圖像處理

物體輪廓

一文讀懂深度學習中的卷積運算與圖像處理

物體紋理

圖片來源:CMU, Computational Photography, Fall 2019

那麼如何區分圖像的特徵與圖像的冗餘信息量呢?如下面這幅人物圖像,如果我們不對原始圖像做處理,很難將圖像的特徵與冗餘信息量區分開來。我們可以換一個角度,不從時空域來區分,而是抓住圖像細節和圖像輪廓紋理的頻率不一樣這一特徵,把一副圖像放在頻域中以區分圖像的細節與圖像的輪廓紋理。我們將這幅人物圖像(左)轉換到頻域中得到頻域中的該圖像(右),離中心點越近的分量頻率越低,離中心點越遠的分量頻率越高。

一文讀懂深度學習中的卷積運算與圖像處理

原圖

一文讀懂深度學習中的卷積運算與圖像處理

頻域圖像


圖片來源:CMU, Computational Photography, Fall 2019

現在我們將用一個模板來分離高低頻分量。如左圖所示的模板1中,其數值取值範圍為0到1。模板中的點越黑其數值月接近於0,越白越接近於1。將模板1與頻域圖像相乘後,就可以只保留高頻部分去除離中心點較近的低頻分量,再將圖像轉換回到空間域中,可以看到圖像的高頻分量(右)是輪廓和紋理特徵。

一文讀懂深度學習中的卷積運算與圖像處理

從左到右(模板1、高頻分量)

圖片來源:CMU, Computational Photography, Fall 2019

同樣的操作方式,將模板2與頻域圖像相乘,頻域圖中的低頻分量可以被選取出來,再將低頻分量轉換到空間域中,可以看到低頻分量代表著細節特徵。這時我們就可以成功地將圖像的輪廓紋理與細節信息從頻率的角度區分開來了。

一文讀懂深度學習中的卷積運算與圖像處理

從左到右(模板2、低頻分量)

圖片來源:CMU, Computational Photography, Fall 2019

以上處理過程,實際就是在頻域中將模板與頻域圖像相乘,以區分圖像輪廓紋理與細節信息的過程。而頻域相乘就等於空間域卷積,這是我們剛才提及到的卷積的重要特性。那麼上述在頻域中的操作等同於空間域中的圖像與空間域中的模板做卷積,這樣我們從頻域的角度,就可以解釋卷積操作能夠提取圖像特徵的原因。

想學習更多關於深度學習的知識嗎?想在人工智能領域有所作為嗎?華為推出人工智能認證,目前已發佈HCIA-AI、HCIP-AI HiAI Developer 、HCIP-AI EI Developer。學習華為人工智能認證,你將理解深度學習、計算機視覺、語音識別和自然語音處理等理論;具備基於華為移動終端AI和企業AI平臺的應用開發能力;具備基於業界主流AI開源框架的應用開發能力。

關於卷積運算與圖像處理或華為人工智能認證,你有什麼想問想說的?歡迎在下方評論區留言,華為專家將親自為你解答。

一文讀懂深度學習中的卷積運算與圖像處理


分享到:


相關文章: