深度學習基礎學習(一)為什麼要進行特徵提取

深度學習基礎學習 | 為什麼要進行特徵提取

深度學習基礎學習(一)為什麼要進行特徵提取

為什麼要進行特徵提取?

在計算機中,圖片以有序的多維矩陣進行存儲,按顏色分為灰度圖片用二維數組存儲圖片的像素值,和彩色圖片用三維數組存儲圖片的三個通道顏色的像素值。

以圖片大小為64×128×3為例,即計算機中使用24576個數字來存儲一張圖片,若圖像數目較少,可以利用圖片矩陣作為圖像特徵進行一系列操作,但實際應用場景中數據量都非常龐大,若直接以圖片的存儲矩陣作為圖像特徵進行各類運算,則將佔用大量的存儲和計算資源,是非常浪費且不合理的。

深度學習基礎學習(一)為什麼要進行特徵提取

然而,根據人們的經驗,例如人們可以根據一個人的頭部便可判斷這個人是誰,而不一定需要整個人的圖片,同理,這樣巨大的數據中存儲的信息對計算機而言也不全部都是必要的,存在一定的冗餘信息,可以通過一定的降維方法,對圖片數據進行降維,或者稱為從圖片中提取特徵,存儲圖片的重要信息,利用特徵對圖片進行更多的操作。

深度學習基礎學習(一)為什麼要進行特徵提取

圖片的特徵提取是深度學習中最為基礎也是最為重要的研究問題,特徵提取可以簡單的看作一個數據降維過程,特徵提取過程即是將圖片數據轉化為具有一定區分度的一定維度的向量的圖片特徵的過程

利用圖像特徵進行圖片運算,明顯降低了存儲和計算複雜度。但是,這裡也引出了一個問題,即如何提取有辨別度的圖片特徵

在計算機視覺領域中,圖片特徵可以手工特徵深度學習特徵進行劃分。

手工特徵:

主要根據特定的目的人們設計特定的算法將圖片轉化為一定維度的數據進行表示,最著名的有尺度不變特徵變換特徵(SIFT特徵)和有向梯度直方圖特徵(HOG特徵)。SIFT特徵根據高斯差分函數計算而來,具有旋轉、光照不變性;而

HOG特徵則經過對圖片統計量進行處理而得。

深度學習特徵:

深度學習基礎學習(一)為什麼要進行特徵提取

主要指通過卷積神經網絡提取圖片特徵,常用的有VGG和ResNet分類網絡。


分享到:


相關文章: