【3分鐘學技術】人工智能如何用“眼睛”分辨鳥和貓?

本文字數1870字,閱讀時間預計3分鐘,加入華為認證圈子,獲取最新華為職業技術認證新資訊,學習華為公開課,專家專欄帶你瞭解ICT(信息通信技術)行業關鍵技術。

文末“瞭解更多”免費獲得華為零基礎入門AI(人工智能)課程。


作者:華為人工智能高級講師 王豪聰

華為人工智能專業建設首席架構師 張志峰

隨著計算機技術的不斷髮展,網絡上的圖像數據越來越多。根據GIV組織的預測,到2025年,所有網絡數據中89%是圖片(視頻)數據。因此,圖像處理技術變得越來越重要。在眾多圖像處理算法中,卷積神經網絡是最重要的一種,被大量應用於計算機視覺、自然語言處理等人工智能領域 。

什麼是卷積神經網絡?

聽到“卷積”、“神經網絡”,你腦海中也許會浮現下面的場景:

【3分鐘學技術】人工智能如何用“眼睛”分辨鳥和貓?

是的,這是卷積核在計算機中運算時的樣子,但我們將用另一種直白易懂的方式來理解這個過程。

你可以想象這樣一個場景:有一隻貓和一隻鳥,你將如何區別它們呢?

面對這個問題,你的第一反應是什麼?“鳥有翅膀”、“貓有四條腿”、“它們的尾巴不同”、“鳥的嘴是尖的,貓不是”等等。實際上,這是對我們人類認知系統最簡單的一次測試。從中我們可以發現,任何一個物體都是以一個個最簡單的特徵存儲在我們的認知系統中。需要對事物進行判斷時,認知系統會首先給出一個最簡單的區別特徵,這也是認知系統的工作方式——化繁為簡:以每個特徵為最小單位進行區別,從局部到全局進行特徵提取並匹配,最終得出一個認知結果。

【3分鐘學技術】人工智能如何用“眼睛”分辨鳥和貓?

通過卷積核尋找特徵

上面這張圖就是一個簡單的卷積神經網絡的架構圖。我們可以將一個個卷積核理解為一個個特徵,圖中K1,K2……Kn代表不同的卷積核也就是不同特徵。回到剛才的場景中,假設這個神經網絡實現的功能就是對鳥和貓進行區分。那麼卷積核K1可能代表 “翅膀”,卷積核K2可能代表“嘴巴”,卷積核Kn可能代表“爪子”,當一張圖片進入到這個認知系統,一個個卷積核會去處理這個圖片,尋找其代表的特徵。從圖片的左上角一步步,一行行移動並匹配特徵,尋找圖片中與目標特徵相似的位置,輸出一張特徵圖片,圖片中的每個點都代表圖中每個區域是否有我們要找的那個特徵。如下面這張圖,這是一張卷積後的特徵圖,圖中每個點代表原區域與特徵的相似程度,數值越高,相似程度越高。

【3分鐘學技術】人工智能如何用“眼睛”分辨鳥和貓?

池化層加工提煉

卷積層之後通常會跟一層池化層,並進行下圖的操作。

【3分鐘學技術】人工智能如何用“眼睛”分辨鳥和貓?

從圖中可以看出,經過池化層,我們僅保留各自池化區域中數值最大的部分,將4X4的圖片縮小成2X2的圖片。在卷積神經網絡中,池化層也是非常重要的。試想一下,如果卷積後的結果代表著與特徵的相似程度,而我們認知、分類的關鍵就是特徵,那麼我們只要找到最具特徵的部分進行處理,篩選出重要部分即可。同時,通過池化層縮小尺寸後,也減少了神經網絡的計算量。

池化層還有一個關鍵作用就是擴大了卷積核的作用範圍。試想一下,當對上圖2X2的特徵圖再次進行卷積時,就相當於對原4X4的圖片進行了卷積,這使得在多次池化後,我們要尋找的特徵可能不是“局部”細節特徵而是“全局”的風格特徵或輪廓特徵,這也給我們的神經網絡提供了更強的穩定性。

經過以上兩步,一張圖片的主要特徵已經被我們提取出來了。現在認知系統知道這個圖片中“有翅膀”、“有爪子”、“有尖尖的嘴巴”。那麼下一步如何根據這些結果分析出這張圖是屬於鳥還是貓呢?

全連接層進行分類

這時,全連接層的作用就顯現了——分類!

【3分鐘學技術】人工智能如何用“眼睛”分辨鳥和貓?

如果我們將具備一種特徵標記為1,不具備該特徵標記為0,如上圖所示。那麼貓的類別就是0101,鳥的類別就是1110。這就是全連接層的作用:將我們提取出的特徵進行彙總分類,來完成整個認知系統的最後一步。

當然,一個真正的卷積神經網絡要比我們假設的場景要複雜得多,每一個卷積層和池化層都包含了大量的神經元結構,我們也會應用更多種類的卷積核和其他正則化方法來提高網絡的能力。

如今,全世界的學者也提出了很多經典的卷積神經網絡模型,如:Resnet,VGG16,inception V3等。但神經網絡最核心的特點還是以卷積核為基礎,分解輸入數據為一個個特徵,從而由局部至整體對數據進行分析。也正是卷積神經網絡的這個優點,使得它在圖像領域取得了非常矚目的成就。同時,卷積神經網絡對旋轉、縮放、位移的魯棒性使得它對數據特徵的分析、處理得非常準確,使其應用也已經開始向其他領域拓展,如:字符識別、語音識別等。

看完利用卷積神經網絡對貓和鳥進行分類,是不是覺得能秒懂高大上的人工智能技術?在華為AI認證的課程中,我們將深入淺出地講解包括卷積神經網絡在內的有關人工智能的各方面的知識,讓你學到人工智能的紮實理論並應用到實踐中。


【3分鐘學技術】人工智能如何用“眼睛”分辨鳥和貓?


分享到:


相關文章: