GAN是如何工作的？在MNIST數據集上如何演示GAN的一個簡單實現？

2019-11-04 14:37:08 程序員書屋

從偽造活動門票的故事中，可以非常直觀地看出GAN的思想。為了清楚地理解GAN是如何工作的以及如何實現它們，本節將會在MNIST數據集上演示GAN的一個簡單實現。

首先，需要構建GAN網絡的核心，它由兩個主要部分組成：生成器和判別器。生成器將會嘗試從某個特定的概率分佈中想象或者偽造數據樣本；而可以訪問和查看實際數據樣本的判別器將會判斷生成器的輸出是在設計中存在缺陷還是它與原始數據樣本非常接近。與前面的活動場景相似，生成器的整個目的就是使得判別器相信生成的圖像是來自真實數據集的，以此來試圖欺騙判別器。

訓練過程和前面的故事有著相似的結尾，生成器最終將會設法生成與原始數據樣本看起來非常相似的圖像。

圖14.2顯示了GAN的典型結構，將在MNIST數據集上訓練GAN。圖14.2中的隱藏樣本部分是一個隨機想法或者向量，生成器將會使用它來從真實圖像中複製出虛假圖像。

圖14.2　針對MNIST數據集的通用GAN架構

正如前文提到的，作為一個判斷者，判別器將嘗試從生成器設計的虛假圖像中分辨出真實圖像。所以這個網絡將產生一個二值輸出，二值輸出可以使用sigmoid函數來表示（0表示輸入的是虛假圖像，1表示輸入的是真實圖像）。

現在繼續實現這個架構，看它在MNIST數據集上的表現如何。

從導入此實現所需的庫開始。

%matplotlib inline
import matplotlib.pyplot as plt
import pickle as pkl
import numpy as np
import tensorflow as tf

因為這裡使用了MNIST數據集，所以將會使用TensorFlow輔助函數來獲取數據集，並將它存儲在某處。

from tensorflow.examples.tutorials.mnist import input_data
mnist_dataset = input_data.read_data_sets('MNIST_data')

輸出如下。

Extracting MNIST_data/train-images-idx3-ubyte.gz
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz

14.2.1　模型輸入

在深入構建由生成器和判別器表示的GAN的核心之前，先定義計算圖的輸入。如圖14.3所示，需要兩個輸入：一個輸入是真實圖像，會把它提供給判別器；另一個輸入稱為隱空間，會將它提供給生成器，並用於生成虛假圖像。

# Defining the model input for the generator and discrimator
def inputs_placeholders(discrimator_real_dim, gen_z_dim):
 real_discrminator_input = tf.placeholder(tf.float32, (None,
discrimator_real_dim), name="real_discrminator_input")
 generator_inputs_z = tf.placeholder(tf.float32, (None, gen_z_dim),
name="generator_input_z")
 return real_discrminator_input, generator_inputs_z

圖14.3　在MNIST數據集上實現的GAN架構

下面開始深入構建GAN架構的兩個核心組件。首先從構建生成器部分開始。如圖14.3所示，生成器將包含至少一個隱藏層，它將作為一個近似器。此外，將會採用一種稱為Leaky ReLU的激活函數，而不是通用的ReLU激活函數。這將允許梯度值在層與層之間隨意流動（關於Leaky ReLU的更多信息將會在14.2.3節中介紹）。

14.2.2　變量作用域

變量作用域是TensorFlow中的一個特性，作用域有助於執行如下操作。

確保有一些命名約定，以便後續檢索變量。例如，通過使變量以單詞generator或discriminator開頭，這在網絡訓練期間將有所幫助。其實也可以使用名字作用域特性，但是這個特性不能幫助我們實現第二個目的。
能夠重複使用或重複訓練有不同輸入的相同網絡。例如，我們將從生成器中對虛假圖像進行採樣，來查看生成器複製原始圖像的性能如何。此外，判別器可以訪問真實圖像和虛假圖像，這使得在構建計算圖時可以輕鬆地重用變量而不是創建新變量。

以下語句將說明如何使用TensorFlow中的變量作用域特性。

with tf.variable_scope('scopeName', reuse=False):
 # Write your code here

讀者可以在TensorFlow官網中搜索“variable scope”來了解關於使用變量作用域特性的更多好處。

14.2.3　Leaky ReLU

前文提到，使用與ReLU激活函數不同版本的激活函數——Leaky ReLU。傳統版本的ReLU激活函數通過其他方式將負值截斷為零，只會取輸入值和零值中的最大值。而這裡使用的Leaky ReLU版本允許存在一些負值，因此得名Leaky ReLU。

有時使用傳統的ReLU激活函數，網絡會陷入一種常態——死亡狀態，這是因為網絡所有的輸出全為零。

Leaky ReLU的思想是通過允許一些負值傳遞來阻止這種死亡狀態。

使生成器工作的整個思想就是從判別器接收梯度值，並且如果網絡陷入死亡狀態，學習過程就不會出現。

圖14.4和圖14.5顯示了傳統ReLU與Leaky ReLU激活函數之間的不同。

圖14.4　ReLU激活函數

圖14.5　Leaky ReLU激活函數

因為Leaky ReLU激活函數並沒有在TensorFlow中實現，所以需要我們自己去實現它。如果輸入為正數，此激活函數的輸出也為正數；如果輸入為負數，則此激活函數的輸出將是一個受控制的負值。這裡將使用一個稱為alpha的參數來控制負值，通過允許傳遞一些負值來引入網絡的容錯性。

下面的等式表示需要實現的Leaky ReLU函數。

f(x) = max(ax,x)

14.2.4　生成器

把MNIST圖像歸一化到0～1，從而使得sigmoid激活函數充分發揮作用。但實際上，我們發現tanh激活函數比其他任何函數都具有更好的性能。因此為了使用tanh激活函數，需要將這些圖像的像素值範圍重新縮放到−1～1。

def generator(gen_z, gen_out_dim, num_hiddern_units=128, reuse_vars=False,
leaky_relu_alpha=0.01):
 ''' Building the generator part of the network 

 Function arguments
 ---------
 gen_z : the generator input tensor
 gen_out_dim : the output shape of the generator
 num_hiddern_units : Number of neurons/units in the hidden layer
 reuse_vars : Reuse variables with tf.variable_scope
 leaky_relu_alpha : leaky ReLU parameter
 Function Returns
 -------
 tanh_output, logits_layer:
 '''
 with tf.variable_scope('generator', reuse=reuse_vars):
 # Defining the generator hidden layer
 hidden_layer_1 = tf.layers.dense(gen_z, num_hiddern_units,
activation=None)
 # Feeding the output of hidden_layer_1 to leaky relu
 hidden_layer_1 = tf.maximum(hidden_layer_1,
leaky_relu_alpha*hidden_layer_1)
 # Getting the logits and tanh layer output
 logits_layer = tf.layers.dense(hidden_layer_1, gen_out_dim,
activation=None)
 tanh_output = tf.nn.tanh(logits_layer)
 return tanh_output, logits_layer

現在我們已經準備好了生成器部分，下面繼續定義GAN的第二個組件。

14.2.5　判別器

接下來，構建生成對抗網絡中的第二個主要組件，即判別器。判別器與生成器基本相同，但不使用tanh激活函數，而使用sigmoid激活函數；它將產生一個二值輸出，代表判別器對輸入圖像的判斷。

def discriminator(disc_input, num_hiddern_units=128, reuse_vars=False,
leaky_relu_alpha=0.01):
 ''' Building the discriminator part of the network
 Function Arguments
 ---------
 disc_input : discrminator input tensor 

 num_hiddern_units : Number of neurons/units in the hidden layer
 reuse_vars : Reuse variables with tf.variable_scope
 leaky_relu_alpha : leaky ReLU parameter
 Function Returns
 -------
 sigmoid_out, logits_layer:
 '''
 with tf.variable_scope('discriminator', reuse=reuse_vars):
 # Defining the generator hidden layer
 hidden_layer_1 = tf.layers.dense(disc_input, num_hiddern_units,
activation=None)
 # Feeding the output of hidden_layer_1 to leaky relu
 hidden_layer_1 = tf.maximum(hidden_layer_1,
leaky_relu_alpha*hidden_layer_1)
 logits_layer = tf.layers.dense(hidden_layer_1, 1, activation=None)
 sigmoid_out = tf.nn.sigmoid(logits_layer)
 return sigmoid_out, logits_layer

14.2.6　構建GAN網絡

在定義了構建生成器和判別器組件的主要函數之後，下面將它們堆疊起來，然後為此實現定義模型損失和優化器。

1．模型超參數

可以通過改變下面一組超參數來微調GAN。

# size of discriminator input image
#28 by 28 will flattened to be 784
input_img_size = 784
# size of the generator latent vector
gen_z_size = 100
# number of hidden units for the generator and discriminator hidden layers
gen_hidden_size = 128
disc_hidden_size = 128
#leaky ReLU alpha parameter which controls the leak of the function
leaky_relu_alpha = 0.01
# smoothness of the label
label_smooth = 0.1

2．定義生成器和判別器

在定義了用於生成虛假MNIST圖像（看起來和真實圖像基本相同）的GAN架構的兩個主要組件之後，下面使用目前已經定義的函數來構建網絡。構建網絡將遵循以下步驟。

（1）定義模型輸入，輸入包含兩個變量。其中一個變量是真實圖像，把它輸入判別器，另一個變量是生成器用於複製原始圖像的隱空間。

（2）調用前面定義的生成器函數來構建網絡的生成器部分。

（3）調用前面定義的判別器函數來構建網絡的判別器部分，但是這裡會調用該函數兩次。第一次調用針對真實數據，第二次調用針對生成器生成的虛假數據。

（4）通過重用變量來保持真實圖像和虛假圖像的權重是一樣的。

tf.reset_default_graph()
# creating the input placeholders for the discrminator and 
generator
real_discrminator_input, generator_input_z =
inputs_placeholders(input_img_size, gen_z_size)
# Create the generator network
gen_model, gen_logits = generator(generator_input_z,
input_img_size, gen_hidden_size, reuse_vars=False, 

leaky_relu_alpha=leaky_relu_alpha)
# gen_model is the output of the generator
# Create the generator network
disc_model_real, disc_logits_real =
discriminator(real_discrminator_input, disc_hidden_size,
reuse_vars=False, leaky_relu_alpha=leaky_relu_alpha)
disc_model_fake, disc_logits_fake = discriminator(gen_model,
disc_hidden_size, reuse_vars=True,
leaky_relu_alpha=leaky_relu_alpha)

3．判別器與生成器損失

這一部分需要定義判別器和生成器損失，可以認為這是此實現中最富有技巧的部分。

我們知道生成器試圖偽造原始圖像，並且判別器作為判斷者，同時接收來自生成器和原始輸入的圖像。因此在為每一部分設計損失時，需要關注兩件事。

首先，網絡的判別器部分要能夠區分由生成器生成的虛假圖像和來自原始訓練樣本的真實圖像。在訓練時，將給判別器部分提供一批分為兩類的數據。第一類是來自原始輸入的圖像，第二類是生成器生成的虛假圖像。

因此，判別器最終的總損失將是它接受真實圖像為真實圖像並且檢測假圖像為虛假圖像的能力之和。最終的總損失如下。

disc_loss = disc_loss_real + disc_loss_fake

tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=logits_layer,
labels=labels))

然後，需要計算兩個損失才能得到最終的判別器損失。

第一個損失disc_loss_real將會根據從判別器和labels獲得的logits值計算出來。在這種情況下，labels的值全都為1，因為此時最小批次中所有圖像都來自MNIST數據集中的真實輸入圖像。為了增強模型在測試集上的泛化能力並給出更好的結果，我們發現其實將labels的值從1改為0.9會更好。標籤的這種改變稱為標籤平滑。

labels = tf.ones_like(tensor) * (1 - smooth)

判別器損失的第二部分是判別器能夠檢測虛假圖像的能力，損失介於從判別器獲得的logits值和labels值之間。此時，所有的labels值都是零，因為已知這個最小批次中的所有圖像都來自生成器，而不是來自原始輸入。

既然已經討論了判別器損失，那麼同樣也需要計算生成器損失。生成器損失稱為gen_loss，它介於disc_logits_fake（判別器對於虛假圖像的輸出）和標籤（全都為1，因為生成器試圖使判別器相信它生成的虛假圖像）之間。

# calculating the losses of the discrimnator and generator 

disc_labels_real = tf.ones_like(disc_logits_real) * (1 - label_smooth)
disc_labels_fake = tf.zeros_like(disc_logits_fake)
disc_loss_real =
tf.nn.sigmoid_cross_entropy_with_logits(labels=disc_labels_real,
logits=disc_logits_real)
disc_loss_fake =
tf.nn.sigmoid_cross_entropy_with_logits(labels=disc_labels_fake,
logits=disc_logits_fake)
#averaging the disc loss
disc_loss = tf.reduce_mean(disc_loss_real + disc_loss_fake)
#averaging the gen loss
gen_loss = tf.reduce_mean(
 tf.nn.sigmoid_cross_entropy_with_logits(
 labels=tf.ones_like(disc_logits_fake),
 logits=disc_logits_fake))

4．優化器

最後是優化器部分。在本節中，將會定義訓練過程中使用的優化標準。首先，將分別更新生成器和判別器的變量，因此需要能夠檢索每一部分的變量。

對於第一個優化器（即生成器1），將從計算圖中的可訓練變量中檢索以generator名稱開頭的所有變量，然後通過參考其名稱來檢查每個變量屬於哪一模塊。

同樣也要對判別器的變量做同樣的操作，方法是令其所有變量都以discriminator開頭。在這之後，就可以將想要優化的變量列表傳遞給優化器。

TensorFlow的變量作用域特性使得我們能夠檢索以某個字符串開頭的變量，然後會有兩個不同的變量列表，一個用於生成器，另一個用於判別器。

# building the model optimizer
learning_rate = 0.002
# Getting the trainable_variables of the computational graph, split into
Generator and Discrimnator parts
trainable_vars = tf.trainable_variables()
gen_vars = [var for var in trainable_vars if
var.name.startswith("generator")]
disc_vars = [var for var in trainable_vars if
var.name.startswith("discriminator")]
disc_train_optimizer = tf.train.AdamOptimizer().minimize(disc_loss,
var_list=disc_vars)
gen_train_optimizer = tf.train.AdamOptimizer().minimize(gen_loss,
var_list=gen_vars)

本文截選自《深度學習案例精粹》第14章，[愛爾蘭] 艾哈邁德·曼肖伊（Ahmed Menshawy）著，洪志偉，曹檑，廖釗坡譯。

本書使用目前廣泛應用的深度學習框架之一—TensorFlow以及非常流行的Python語言進行代碼示例，想要進一步學習的讀者將會有極多的社區資源。

本書主要講述了深度學習中的重要概念和技術，並展示瞭如何使用TensorFlow實現高級機器學習算法和神經網絡。本書首先介紹了數據科學和機器學習中的基本概念，然後講述如何使用TensorFlow訓練深度學習模型，以及如何通過訓練深度前饋神經網絡對數字進行分類，如何通過深度學習架構解決計算機視覺、語言處理、語義分析等方面的實際問題，最後討論了高級的深度學習模型，如生成對抗網絡及其應用。

分享到:

閱讀更多 程序員書屋 的文章

關鍵字: 設計集上如何

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"