2019-09-06 23:01:00 Python部落

Keras是一個簡單易用但功能強大的 Python 深度學習庫。在這篇文章中，我們將用 Keras 構建一個簡單的卷積神經網絡（CNN），並訓練它來解實際問題。

這篇文章適用於完全初學 Keras 的人，但假設有 CNNs 的基本背景知識。我對卷積神經網絡的介紹涵蓋了你在這篇文章中需要知道的一切（以及更多內容），如果需要，請先閱讀。

我們現在就開始!

想要代碼嗎？完整的源代碼在末尾。

問題：MNIST數字分類

我們將處理一個經典的計算機視覺入門問題：MNIST 手寫數字分類。很簡單：給定一個圖像，將其分類為一個數字。

MNIST 數據集中的樣本圖像

MNIST 數據集中的每個圖像都是 28x28，包含一個居中的灰度數字。我們的 CNN 將獲取一個圖像並輸出 10 個可能的類中的一個（每個數字一個）。

1. 安裝

我假設你已經有了一個基本的 Python 安裝（可能是這樣）。讓我們先下載一些我們需要的包：

注意：我們需要安裝 tensorflow ，因為我們要在 TensorFlow 後端上運行 Keras（即 TensorFlow 將裝備 Keras ）。

現在你應該能夠導入這些包並瀏覽 MNIST 數據集：

在開始之前，我們將把圖像像素值從 [0，255] 規範化為 [-0.5，0.5] 以使網絡更容易訓練（使用較小的中心值通常會得到更好的結果）。我們還將把每個圖像從（28，28）改為（28，28，1），因為 Keras 需要第三維度。

我們準備好開始構建我們的 CNN 了！

每個 Keras 模型要麼使用表示層的線性堆棧的 Sequential 類構建，要麼使用更可定製的功能 Model 類。我們將使用更簡單的Sequential 模型，因為我們的 CNN 將是一個層的線性堆棧。

我們首先實例化一個 Sequential 模型：

Sequential 構造函數接受一個 Keras Layers 數組。我們將為 CNN 使用三種類型的層：卷積層、最大池層和 Softmax 層。

這是我們在我的 CNN 簡介中使用的 CNN 設置。如果你對這三種層的任何一種都不滿意的話，請閱讀這篇文章。

num_filters, filter_size 和 pool_size 是設置 CNN 超參數的自解釋變量。
任何 Sequential 模型中的第一層都必須指定輸入 input_shape，因此我們在 Conv2D上執行此操作。一旦指定了此輸入形狀，Keras 將自動推斷後續層的輸入形狀。

在開始培訓之前，我們需要配置訓練過程。我們在編譯過程中確定了3個關鍵因素：

優化器。我們將堅持用一個非常好的默認設置：Adam 基於梯度的優化器。Keras 還有許多其他優化器，你也可以查看。
損失函數。因為我們使用的是 SoftMax 輸出層，所以我們將使用交叉熵損失。Keras 區分 binary_crossentropy （2類）和 categorical_crossentropy（>2 類），因此我們將使用後者。查看所有的 Keras 損失函數.
度量列表。因為這是一個分類問題，所以我們只會有關於準確度度量的 Keras 報告。

下面是編譯的樣子：