上一課!神經網絡是什麼?有什麼作用?

全文共3046字,預計學習時長

9分鐘

上一課!神經網絡是什麼?有什麼作用?

圖源:百家號


機器學習是人工智能領域的一個分支,它結合了神經網絡來創建一些人們日常使用的優秀軟件。


如果你使用百度查找的相關資料,則使用了百度的神經網絡,該神經網絡會根據給出的關鍵詞對相關度最高的網頁進行排名。如果你最近要買東西訪問過淘寶官網,那麼該網站推薦的所有產品都是由神經網絡管理的。


即便是現在,當使用手機時,也可能會遇到一種便利生活的神經網絡。神經網絡無所不在,它們以不同的工作方式完成各式各樣的任務。


所以……“神經網絡”是什麼呢?


上一課!神經網絡是什麼?有什麼作用?

圖源:wemedia.ifeng.com


“神經”只是大腦的另一種表達。


“所以這是一個大腦網絡?”


本質上,完全如此!神經網絡是人類最強大的工具——大腦的簡化。它使用的神經元都是通過權重(下圖中的線條)相互連接的。神經元被賦予一些數值輸入,然後乘以權重。權重是神經網絡的核心,通過將權重轉換為特定的數值,就可以處理任何輸入並獲得期望的輸出。


神經網絡只是一種處理數據的方式。而數據本身在此處很關鍵。通過使用各種神經網絡處理數據……就可以構建功能強大的工具來完成一些神奇的事情!


上一課!神經網絡是什麼?有什麼作用?


這其中,有很多神經網絡具有神奇的特性,下面小芯將介紹幾種最著名的:


1. 感知器——最古老最簡單的神經網絡


感知器是最古老的神經網絡,其發明最早可追溯到1958年。它同時也是最簡單的神經網絡。弗蘭克·羅森布拉特(Frank Rosenblatt)發明的感知機為神經網絡的基本原理奠定了基礎。


這種神經網絡只有一個神經元,因此非常簡單。它可接收n個輸入量並將其乘以相應的權重。感知器僅計算一個輸出,因其只能處理單個複雜性級別的數據,複雜性程度低,因而發展受限。


上一課!神經網絡是什麼?有什麼作用?


用例:


· 瞭解人腦

· 擴展用於更高級別的神經網絡


2. 多層感知器——什麼是層?


多層感知器(MLP)本質上仍是感知器,但複雜性通過層的設計而得到增強。在MLP中,有三種類型的層:


輸入層:


顧名思義,輸入層指輸入到神經網絡的數據。輸入數據必須是數值。也就是說非數值的內容需要轉化為數值。在將數據輸入到神經網絡之前對其進行操作的過程稱為數據處理,通常情況下,數據處理過程是製作機器學習模型最耗時的部分。


隱藏層:


隱藏層由神經網絡中的大多數神經元組成,是處理數據以獲得所需輸出的核心部分。數據將穿過隱藏層,並由許多權重和偏差調節。之所以稱其為“隱藏”層,是因為它與輸入和輸出層不同,神經網絡的開發人員並不會直接使用這些層。


輸出層:


輸出層是在神經網絡中處理數據的最終產物,可以表示不同的事物。通常情況下,輸出層由神經元組成,每個神經元代表一個對象,而附加的數值則表示該對象是某特定對象的概率。其他情況下,輸出層可能是一個神經元的輸出,當給定某些輸入時,它就是特定值。


核心思想是:輸出層是神經網絡傳遞數據的結果,也是人們試圖達到的目標。


上一課!神經網絡是什麼?有什麼作用?

前饋神經網絡


此原理是,將數值數據傳送到神經網絡中,然後繼續進行大量運算。讓數據不斷往下傳遞,沒有反饋。為了操作正確,使任何給定輸入始終產生所需輸出,就需要進行訓練。訓練本質上是尋找產生最佳結果的方法,並將其應用於神經網絡。


用例:


  • 計算機視覺
  • 自然語言處理
  • 其他神經網絡的基礎


3. 卷積神經網絡——卷積層?


卷積神經網絡仍使用與多層感知器(MLP)相同的原理,但值得注意的是,它運用了卷積層,卷積神經網絡通常應用於圖像和視頻。


重要的是要認識到圖像只是一個數字網格,每個數字都表示著某個像素的強度。知道了圖像是一個數字網格,就可以通過操作這些數字來找到圖像的模式和特徵。卷積層通過使用濾波器來實現這一點。

上一課!神經網絡是什麼?有什麼作用?

濾波器


濾波器是定義為N x M(N和/M表示網格大小)的數字矩陣,它與原始圖像相乘多次。要了解實際情況,請參閱動畫。


濾波器在網格上移動併產生新值。這些值可以代表圖像中的邊緣或線條。例如,使用以下濾波器:


上一課!神經網絡是什麼?有什麼作用?


水平濾波器會試圖消除垂直中心以外的值。它通過使用負值去除邊緣,使用0消除中心以使像素變為中性。如果過濾成功,將可以從新值中看到一條水平線。對於正好反過來的垂直濾波器也是如此。


在將濾波器應用於整個圖像之後,就可以使用池化層輕鬆地提取濾波器識別的主要特徵。在訓練模型時,確定濾波器應包含的數字。找到最佳數值以使任務達到最佳結果。


池化層


如聞其名,池化層的作用就是將濾波器識別到的最重要特徵“彙集”在一起,這是通過使用多種方法完成的。


一種流行的方式是“最大池化”(Max Pooling),在這個方法中,對於圖像的每個被濾部分,取最大的數目並存儲到一個新的矩陣中。它的基本功能是識別最重要特徵並將其壓縮為一個圖像,以便將其處理為多層感知器模型(MLP)。此過程也稱為數據採樣,使用此過程會產生令人滿意的結果。


用例


· 圖像分類

· 計算機視覺

· 查找圖像特徵/模式


上一課!神經網絡是什麼?有什麼作用?

圖源:www.crazyiter.com


4. 遞歸神經網絡——時態數據?


神經網絡分析的數據並不完全侷限於靜態數據。諸如圖像、數字和幀等都是可以分析的數據。然而,依賴於數據本身的過去實例來預測未來,這是時態數據的示例。股市數據、時間序列數據、腦電波數據等數據總是通過使用因變量的過去實例進行分析。


目前為止,已提及的神經網絡種類無法處理其他狀態的數據,接下來要講的遞歸神經網絡(RNN)才是解決方案。


狀態矩陣


遞歸神經網絡(RNN)通過將最後的輸出存儲於自身內存中來記憶數據的先前狀態。這些稱為狀態矩陣。循環神經網絡的工作原理與多層感知器(MLP)中的普通層類似,但它使用狀態矩陣來計算新的輸出。使用以前輸出和數據狀態本質上考慮了最終的輸出數據,這對於股市預測和時間序列預測等應用至關重要。


上一課!神經網絡是什麼?有什麼作用?


長短期記憶網絡


長短期記憶網絡(LSTM)進一步擴展了將狀態矩陣保存為兩種狀態的想法——長期狀態和短期狀態。如果狀態持續存在於模型輸出中,它將被保存為長期狀態矩陣,並將在考慮新數據時佔據更大權重。


對於連續數據查找模式的應用,LSTM系統非常高效且處於股市指標預測方法的最前沿。


用例


  • 自然語言處理
  • 股市預測
  • 基於時間序列的數據預測


5. 自動編碼器——以壓縮方式呈現數據


大多數神經網絡接收數據並做出某些類型的決策。自動編碼器則有著不同的任務,即找出一種能壓縮數據但不損質量的方法。


在傳統的機器學習中,貼在數據上的標籤與神經網絡的輸出目標並不一樣。而在自動編碼器中,標籤相當於輸入。


因此,在自動編碼器的體系結構中,輸入和輸出層是相同的。隱藏層小於輸入和輸出層(就節點而言),被稱為“瓶頸”。由於瓶頸較小,因此它被迫尋找一種壓縮原始數據並將其放回輸出層的方法。這種壓縮方式一般比常規方法更好,因為它仍然可以保持數據的高質量。


上一課!神經網絡是什麼?有什麼作用?


用例:


· 主要用於以較小的壓縮方式呈現大量數據。


上一課!神經網絡是什麼?有什麼作用?

圖源:Unsplash


現在,你是不是瞭解到了很多神經網絡的知識了?


紙上得來終覺淺,絕知此事要躬行。


立刻行動起來,現在就去將這些神經網絡落實到自己的課題實踐中去吧~

上一課!神經網絡是什麼?有什麼作用?

上一課!神經網絡是什麼?有什麼作用?

我們一起分享AI學習與發展的乾貨


分享到:


相關文章: