Keras學習筆記：分類預測-漂亮的鳶尾花

2020-03-31 08:11:13 風信子編程

Keras是一個用於深度學習的Python庫，它包含高效的數值庫Theano和TensorFlow。

　　本文的目的是學習如何從csv中加載數據並使其可供Keras使用，如何用神經網絡建立多類分類的數據進行建模，如何使用scikit-learn評估Keras神經網絡模型。

1，在LR（邏輯迴歸）中，如何進行多分類？

　　一般情況下，我們所認識的lr模型是一個二分類的模型，但是能否用lr進行多分類任務呢？答案當然是可以的。

　　　不過我們需要注意的是，我們有許多種思想利用lr來進行分類

2，訓練多個二分類器的思想

　　既然天然的lr是用來做二分類，那麼我們很自然地想到把多分類劃分為多個二分類的任務。

　　具體有以下三種策略：

2.1 一對一

　假如某個分類中有N個類別，我們將這N個類別進行兩兩配對（兩兩配對後轉化為二分類問題）。那麼我們可以得到

個二分類器。（簡單解釋一下，相當於在N個類別裡面抽2個）

之後，在測試階段，我們把新樣本交給這

個二分類器。於是我們可以得到

個分類結果。把預測的最多的類別作為預測的結果。

下面，我給一個具體的例子來理解一下。

　　上圖的意思其實很明顯，首先把類別兩兩組合（6種組合）。組合完之後，其中一個類別作為正類，另一個作為負類（這個正負只是相對而言，目的是轉化為二分類）。然後對每個二分類器進行訓練。可以得到6個二分類器。然後把測試樣本在6個二分類器上面進行預測。從結果上可以看到，類別1被預測的最多，故測試樣本屬於類別1。

2.2 一對其餘 (OvR)

一對其餘其實更加好理解，每次將一個類別作為正類，其餘類別作為負類。此時共有（N個分類器）。在測試的時候若僅有一個分類器預測為正類，則對應的類別標記為最終的分類結果。例如下面這個例子。

　　大概解釋一下，就是有當有4個類別的時候，每次把其中一個類別作為正類別，其餘作為負類別，共有4種組合，對於這4中組合進行分類器的訓練，我們可以得到4個分類器。對於測試樣本，放進4個分類器進行預測，僅有一個分類器預測為正類，於是取這個分類器的結果作為預測結果，分類器2預測的結果是類別2，於是這個樣本便屬於類別2。

　　其實，有人會有疑問，那麼預測為負類的分類器就不用管了嗎？是的，因為預測為負類的時候有多種可能，無法確定，只有預測為正類的時候才能唯一確定屬於哪一類。比如對於分類器3，分類結果是負類，但是負類有類別1，類別2，類別4三種，到底屬於哪一種？

2.3 多對多（MvM）

　　所謂多對多其實就是把多個類別作為正類，多個類別作為負類。

3，對於上面的方法其實都是訓練多個二分類器，那麼有沒有更加直接的方法對LR來進行多分類呢？

我們知道，對於二分類的LR時，正類和負類的概率分別如下:

對於多分類，其實我只需要做簡單的修改就可以了。

假設某分類任務有K個類別，那麼對於每一個類別的概率有：

對於第K類來說

對於其餘類而言

一，問題描述

　　在本文學習中，我們將使用鳶尾花數據集的標準機器學習問題。

　　這個數據集經過深入研究，是在神經網絡上練習的一個很好的問題，因為所有4個輸入變量都是數字的，並且具有相同的釐米級別。每個實例描述觀察到的花測量的屬性，輸出變量是特定的鳶尾種類。

　　這是一個多類別的分類問題，意味著有兩個以上的類需要預測，實際上有三種花種。這是用神經網絡練習的一個重要問題類型，因為三個類值需要專門的處理。

　　鳶尾花數據集是一個充分研究的問題，我們可以期望實現模型精度為在95％至97％的範圍內，這為開發我們的模型提供了一個很好的目標。

　　您可以從UCI機器學習庫下載鳶尾花數據集，並將其放在當前工作目錄中，文件名為 “ iris.csv”。

二，導入類和函數

　　我們從導入本文需要的所有類和函數開始。其中包括需要Keras的功能，還包括來自pandas的數據加載以及來自scikit-learn的數據準備和模型評估。

import numpy

import pandas

from keras.models import Sequential

from keras.layers import Dense

from keras.wrappers.scikit_learn import KerasClassifier

from keras.utils import np_utils

from sklearn.model_selection import cross_val_score

from sklearn.model_selection import KFold

from sklearn.preprocessing import LabelEncoder

from sklearn.pipeline import Pipeline

三，初始化隨機數生成器

　　下面，我們將隨機數生成器初始化為常量值（7）

　　這對於確保我們可以再次精確地實現從該模型獲得的結果非常重要，它確保可以再現訓練神經網絡模型的隨機過程。

# fix random seed for reproducibility

seed = 7

numpy.random.seed(seed)

四，記載數據集

　　可以直接加載數據集。因為輸出變量包含字符串，所以最容易使用pandas加載數據。然後我們可以將屬性（列）拆分為輸入變量（X）和輸出變量（Y）。

# load dataset

dataframe = pandas.read_csv("iris.csv", header=None)

dataset = dataframe.values

X = dataset[:,0:4].astype(float)

Y = dataset[:,4]

五，編碼輸出變量

　　輸出變量包含三個不同的字符串值。

　　當使用神經網絡對多類分類問題進行建模時，優良作法是將包含每個類值的值的向量的輸出屬性重新整形為一個矩陣，每個類值都有一個布爾值，以及給定實例是否具有該值是否有類值。

　　這稱為one hot encoding 或者從分類變量創建虛擬變量。

　　例如：在這個問題中，三個類值是Iris-setosa，Iris-versicolor和Iris-virginica。如果我們有觀察結果：

　　多類分類問題本質上可以分解為多個二分類問題，而解決二分類問題的方法有很多。這裡我們利用Keras機器學習框架中的ANN（artificial neural network）來解決多分類問題。這裡我們採用的例子是著名的UCI Machine Learning Repository中的鳶尾花數據集（iris flower dataset）。　　多類分類問題與二類分類問題類似，需要將類別變量（categorical function）的輸出標籤轉化為數值變量。這個問題在二分類的時候直接轉換為（0，1）（輸出層採用sigmoid函數）或（-1，1）（輸出層採用tanh函數）。類似的，在多分類問題中我們將轉化為虛擬變量（dummy variable）：即用one hot encoding方法將輸出標籤的向量（vector）轉化為只在出現對應標籤的那一列為1，其餘為0的布爾矩陣。以我們所用的鳶尾花數據為例：

sample, label

1, Iris-setosa

2, Iris-versicolor

3, Iris-virginica

用one hot encoding轉化後如下：

sample, Iris-setosa, Iris-versicolor, Iris-virginica

1, 1, 0, 0

2, 0, 1, 0

3, 0, 0, 1

　　注意這裡不要將label直接轉化成數值變量，如1,2,3，這樣的話與其說是預測問題更像是迴歸預測的問題，後者的難度比前者大。（當類別比較多的時候輸出值的跨度就會比較大，此時輸出層的激活函數就只能用linear）

我們可以通過首先使用scikit-learn類LabelEncoder將字符串一致地編碼為整數來完成此操作。然後使用Keras函數to_categorical（）將整數向量轉換為一個熱編碼

# encode class values as integers

encoder = LabelEncoder()

encoder.fit(Y)

encoded_Y = encoder.transform(Y)

# convert integers to dummy variables (i.e. one hot encoded)

dummy_y = np_utils.to_categorical(encoded_Y)

六，定義神經網絡模型

　　Keras庫提供了包裝類，允許您在scikit-learn中使用Keras開發的神經網絡模型。

　　Keras中有一個KerasClassifier類，可用作scikit-learn中的Estimator，它是庫中基本類型的模型。KerasClassifier將函數的名稱作為參數。該函數必須返回構建的神經網絡模型，為訓練做好準備。

　　下面是一個函數，它將為鳶尾花分類問題創建一個基線神經網絡。它創建了一個簡單的完全連接的網絡，其中一個隱藏層包含8個神經元。

　　隱藏層使用整流器激活功能，這是一種很好的做法。因為我們對鳶尾花數據集使用了單熱編碼，所以輸出層必須創建3個輸出值，每個類一個。具有最大值的輸出值將被視為模型預測的類。

　　這個簡單的單層神經網絡的網絡拓撲可以概括為：

4 inputs -> [8 hidden nodes] -> 3 outputs

　　請注意，我們在輸出層使用“ softmax ”激活功能。這是為了確保輸出值在0和1的範圍內，並且可以用作預測概率。

　　最後，網絡使用具有對數損失函數的高效Adam梯度下降優化算法，在Keras中稱為“ categorical_crossentropy ”。

# define baseline model

def baseline_model():

# create model

model = Sequential()

model.add(Dense(8, input_dim=4, activation='relu'))

model.add(Dense(3, activation='softmax'))

# Compile model

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

return model

　　我們現在可以創建我們的KerasClassifier用於scikit-learn。

　　我們還可以在構造KerasClassifier類中傳遞參數，該類將傳遞給內部用於訓練神經網絡的fit（）函數。在這裡，我們將時期數量傳遞為200，批量大小為5，以便在訓練模型時使用。通過將verbose設置為0，在訓練時也會關閉調試。

estimator = KerasClassifier(build_fn=baseline_model, epochs=200, batch_size=5, verbose=0)

七，使用k-fold交叉驗證評估模型

Keras是基於Theano或Tensorflow底層開發的簡單模塊化的神經網絡框架，因此用Keras搭建網絡結構會比Tensorflow更加簡單。這裡我們將使用Keras提供的KerasClassifier類，這個類可以在scikit-learn包中作為Estimator使用,故利用這個類我們就可以方便的調用sklearn包中的一些函數進行數據預處理和結果評估（此為sklearn包中模型(model)的基本類型）。　　對於網絡結構，我們採用3層全向連接的，輸入層有4個節點，隱含層有10個節點，輸出層有3個節點的網絡。其中，隱含層的激活函數為relu（rectifier），輸出層的激活函數為softmax。損失函數則相應的選擇categorical_crossentropy(此函數來著theano或tensorflow，具體可以參見這裡)（二分類的話一般選擇activation=‘sigmoid’， loss=‘binary_crossentropy’）。

　　PS：對於多類分類網絡結構而言，增加中間隱含層能夠提升訓練精度，但是所需的計算時間和空間會增大，因此需要測試選擇一個合適的數目，這裡我們設為10；此外，每一層的捨棄率（dropout）也需要相應調整（太高容易欠擬合，太低容易過擬合），這裡我們設為0.2。

　　我們現在可以在訓練數據上評估神經網絡模型。

　　scikit-learn具有使用一套技術評估模型的出色能力。評估機器學習模型的黃金標準是k倍交叉驗證。

　　首先，我們可以定義模型評估程序。在這裡，我們將摺疊數設置為10（一個很好的默認值）並在分區之前對數據進行洗牌。

kfold = KFold(n_splits=10, shuffle=True, random_state=seed)

　　現在我們可以使用10倍交叉驗證程序（kfold）在我們的數據集（X和dummy_y）上評估我們的模型（估計器）。

　　評估模型僅需要大約10秒鐘，並返回一個對象，該對象描述了對數據集的每個分割的10個構建模型的評估。

results = cross_val_score(estimator, X, dummy_y, cv=kfold)

print("Baseline: %.2f%% (%.2f%%)" % (results.mean()*100, results.std()*100))

　　結果總結為數據集上模型精度的均值和標準差。這是對看不見的數據的模型性能的合理估計。對於這個問題，它也屬於已知的最佳結果範圍。

Accuracy: 97.33% (4.42%)

八，代碼實現

import numpy as np

import pandas as pd

from keras.models import Sequential

from keras.layers import Dense, Dropout

from keras.wrappers.scikit_learn import KerasClassifier

from keras.utils import np_utils

from sklearn.model_selection import train_test_split, KFold, cross_val_score

from sklearn.preprocessing import LabelEncoder

# load dataset

dataframe = pd.read_csv("iris.csv", header=None)

dataset = dataframe.values

X = dataset[:, 0:4].astype(float)

Y = dataset[:, 4]

# encode class values as integers

encoder = LabelEncoder()

encoded_Y = encoder.fit_transform(Y)

# convert integers to dummy variables (one hot encoding)

dummy_y = np_utils.to_categorical(encoded_Y)

# define model structure

def baseline_model():

model = Sequential()

model.add(Dense(output_dim=10, input_dim=4, activation='relu'))

model.add(Dropout(0.2))

model.add(Dense(output_dim=3, input_dim=10, activation='softmax'))

# Compile model

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

return model

estimator = KerasClassifier(build_fn=baseline_model, nb_epoch=40, batch_size=256)

# splitting data into training set and test set. If random_state is set to an integer, the split datasets are fixed.

X_train, X_test, Y_train, Y_test = train_test_split(X, dummy_y, test_size=0.3, random_state=0)

estimator.fit(X_train, Y_train)

# make predictions

pred = estimator.predict(X_test)

# inverse numeric variables to initial categorical labels

init_lables = encoder.inverse_transform(pred)

# k-fold cross-validate

seed = 42

np.random.seed(seed)

kfold = KFold(n_splits=10, shuffle=True, random_state=seed)

results = cross_val_score(estimator, X, dummy_y, cv=kfold)

九，總結

在這篇文章中，我們學習瞭如何使用Keras Python庫開發和評估神經網絡以進行深度學習。學習了以下知識：

如何加載數據並使其可用於Keras。
如何使用一個熱編碼準備多類分類數據進行建模。
如何使用keras神經網絡模型與scikit-learn。
如何使用Keras定義神經網絡進行多類分類。
如何使用帶有k-fold交叉驗證的scikit-learn來評估Keras神經網絡模型

分享到:

閱讀更多 風信子編程 的文章

關鍵字: 筆記鳶尾漂亮

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"