Mini-patch：從零開始的反向傳播（附詳細代碼）_ _ 頭條網

文章將重點介紹mini-patch逐步實現的反向傳播算法。有許多教程和博客詳細介紹了反向傳播算法，以及演算和代數背後的所有邏輯。因此，我將跳過這一部分，並在數學和使用Python的實現中切入方程式。

關於為什麼我們應該從頭開始實現一個算法，即使幾乎所有框架都已經可以使用它，這也是一個長期存在的普遍問題。顯然，在使用某些高級框架時，你甚至都不會注意到反向傳播確實發揮了魔力。要完全顛倒地理解它，一次嘗試肯定是不夠的。反向傳播在遊戲中也是可以進行實驗的。

為什麼要使用mini-patch？

mini-patch的原理很簡單。通過將數據分成小批處理，並在訓練循環的每次迭代中為算法提供一部分數據集，可以節省內存和處理時間。一次饋入10000x10000矩陣不僅會消耗內存，還會花費很長時間才能運行。相反，每次迭代將其降低到50個不僅會減少內存使用量，而且可以跟蹤進度。

注意：這與隨機方法不同，在隨機方法中，我們從每個類別的數據中抽取了分層樣本，並在假設模型可以推廣的基礎上進行訓練。

開始實驗

這是將用於實驗的數據頭。

此處的目標變量是佔用率，它是類別變量（0/1）。這將是我們將要編碼的架構。

算法：

對於i：= 1到i：= m：

執行正向傳播或正向傳遞以計算每一層中神經元的激活值。

反向傳播步驟：

使用數據中的標籤計算誤差項（MSE或LogLoss或您的期望）：

隱藏層中的誤差項使用以下公式計算：

設置梯度：
初始化Δ= 0

3.梯度下降和權重更新步驟：

代碼展示：

<code>weight_dim = [5,H,1] #[number of input features, number of hidden units, number of output units] print("Initializing using He initialization") np.random.seed(3) w1 = np.random.randn(weight_dim[1],weight_dim[0]) * np.sqrt(2/weight_dim[0]) # 0.01 b1 = np.zeros((weight_dim[1],1)) w2 = np.random.randn(weight_dim[2],weight_dim[1]) * np.sqrt(2/weight_dim[1]) # 0.01 b2 = np.zeros((weight_dim[2],1))/<code>

如前所述，這將是一個三層網絡。為了使梯度和誤差方程更好，更容易地識別，我們保持層的數量簡潔。之後，我們將定義一個函數，該函數將用作網絡中的轉發器。

<code>def forward(X,w1,w2,b1,b2): z1 = np.matmul(w1,np.transpose(np.asmatrix(X))) + b1 a1 = sigmoid(z1) z2 = np.matmul(w2, a1) + b2 a2 = sigmoid(z2) return z1, a1, z2, a2/<code>

這裡要注意的一件事是，已經將Input層視為我的第0層。可能還有其他博客/教程被認為是第一名。因此，絕對要為所需的索引編制索引。

因此，現在，在初始化權重和偏差並定義前向傳播函數之後，我們將在size = data-of-setset / N的mini-patch上定義反向傳播函數。通過調整N來調整所需的批次大小。

<code>def backprop(w1,b1,w2,b2,X_train,X_test): for i in range(epoch): no_of_batches = len(X_train) // N for j in range(no_of_batches): # Initilazing gradients delta1 = np.zeros(w1.shape) #(5,5) delta2 = np.zeros(w2.shape) #(1,5) db1 = 0.0 db2 = 0.0 for row in range(j*N,(j+1)*N): # Drop the date column and the index column X = X_train[row, 2:7] Y = X_train[row, 7] #feed forward z1 , a1 , z2 , a2 = forward(X,w1,w2,b1,b2) #(5,1) (5,1) (1,1) (1,1) h = a2 # (1,1) # initializations d3 = a2 - Y #(1,1) delta2 += d3 * np.transpose(a2) #(1,1) db2 += d3 d2 = np.multiply((np.transpose(w2) * d3), sigmoid_gradient(z1),dtype=float) #(5,1) delta1 += d2 * np.transpose(a1) #(5,5) db1 += d2 # Gradient Descent Step #updating weights after every batch by averaging the gradients w1 = w1 - lr * 1.0/N * delta1 #taking the average of gradients b1 = b1 - lr * 1.0/N * db1 w2 = w2 - lr * 1.0/N * delta1 b2 = b2 - lr * 1.0/N * db2 print("************************************************") print("Train error after epoch {} is: ".format(i), np.sum(error(calc_out(X_train[:,2:7],w1,b1,w2,b2),X_train[:,7])) / len(X_train) * 100) print("Test error after epoch {} is: ".format(i), np.sum(error(calc_out(X_test[:,2:7],w1,b1,w2,b2),X_test[:,7])) / len(X_test) * 100) print("************************************************") print() train_error[i] = np.sum(error(calc_out(X_train[:,2:7],w1,b1,w2,b2),X_train[:,7])) / len(X_train) * 100 test_error[i] = np.sum(error(calc_out(X_test[:,2:7],w1,b1,w2,b2),X_test[:,7])) / len(X_test) * 100 return [w1,b1,w2,b2]/<code>

步驟分解

如前所述，Ist循環會遍歷您想要使模型遍歷數據的次數，只需將其放在神經網絡術語“時代”中即可。第二次循環：指定了批次數量後，此循環針對每個時期“ i”遍歷每個微型批次第三循環遍歷該小批量中的每個訓練示例，並計算梯度和誤差值最後，對於每個批次，都執行梯度下降步驟，並對權重矩陣進行更改。

這就是mini-patch的反向傳播實現。需要注意的是，此實驗為網絡中的每一層使用了一個矩陣變量，當網絡規模擴大時，這是一種不明智的做法，我們這樣做是為了瞭解它的實際工作原理。如果要增加“隱藏層”的數量，可以簡單地使用3d矩陣進行誤差和梯度計算，其中第3維將保存該層的值。

為什麼要使用mini-patch？

相關文章:

FF-STAR MINI 潮流閃光包勾起—梅姑回眸一笑的思念

MINI F56改裝AP9540剎車 ADVAN TC4輪轂

M1芯片+2020 Mac mini：一場變革的開始

Q版丶低價丶簡易合體：13公分《Mini Deformed 超電磁波羅五號》

適配三款TurboGrafx-16 Mini 八位堂推出TG16無線控制器

10月蘋果發佈會，新版Mac mini、MacBook、Ipad pro或將同時發佈

前晚更新了 iPad mini，昨晚更新了 iMac，今晚更新 AirPods 2？

減壓舒心我靠它，Breo養生小管家——倍輕鬆Scalp mini Pro測評

2018款Mac mini，配置、價格、發售日期，都在這裡！

我為什麼突然買了一臺 Mini PC

精神寄託— Mini World

買就完了！iPhone12 mini/Pro Max今晚9點預售

iPhone12 真香還是慎入？

重磅！聯建光電與康佳又有新動作，Mini

真香機，難怪48%的人想買iPhone12 mini，很值

華為註冊Mate Mini和Mate Smart商標，難道要造車？

《MINI TALK》

Mini LED逐步實現商業化，頭號受益者為封裝行業

MINI×松北香格里拉，打造冰宮奇妙夜

表妹買車MINI和嘉年華同價位選嘉年華，為什麼？

清新系列—小仙女喜愛的PaMu Slide Mini

兩種續航，“迷你版五菱宏光”MINI EV5月開啟預售

Razer推出緊湊型麥克風Seiren Mini：售價50美元

OXD車隊車手郭海生連上兩場領獎臺

Adidas重回MINI亞洲挑戰賽，優秀成績令觀眾備受欣喜

必勝客 x MINI | 燃情出發，必勝客Mini車友會招募啦

Giomic車隊車手李皓聲，在賽場中學習比賽的真諦

Mini LED行情，看好京東方、深康佳、TCL、三安光電和利亞德

全面屏手機壁紙，經典時刻

Mini Cooper SE的輪圈更名Power Spoke 在美售約22萬元

只是價格良心？這幾個才是我入手iPad mini的理由！

MINI藍改粉，粉嫩粉嫩的，呆萌，可憐老夫的少女心

二手MINI10萬以內也挺好玩的

初入Mac坑：Apple 蘋果 Mac mini 一個月使用感受

Madv mini 試用體驗

最新爆料蘋果新機6.1英寸被命名為iPhone12 mini

新款iPad mini5蜂窩版：7.9寸視網膜屏+A12仿生芯片 售價3896元起

小米電視大師至尊紀念版登場！8K+Mini LED 售價49999元

滿滿的夏日氣息，MINI COUNTRYMAN特別版發佈

QLED, Mini LED, Micro LED 的介紹

盒馬走出“盒區房”？！

從阿根廷到阿勒泰，我自駕走過了雪湖和沙漠

官宣：新 Mac mini 發佈了，擁有史上最強的性能，6499 元起

路邊老大爺也能飛！大疆DJI Mini 2無人機評測：簡單又強悍

將搭載凱華BOX軸！Ducky One 2 Mini RGB機械鍵盤發佈

搭載 mini-LED 屏幕的 iPad Pro 或許會被推遲至明年

華燦光電：Mini LED 是公司增長速度最快的產品線

MINI JCW CHALLENGE 參加2020年英國的改裝車展

聚飛光電——Mini LED龍頭 小漫步者

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

當我們在談 SaaS 的時候，在談什麼？

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

5月西安招聘會時間安排來了！找工作的別錯過

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

“幫助當地居民解決用水難題”-今日頭條-手機光明網

灌籃高手無水印壁紙，每一張都是回憶

通遼藍天救援隊成功解救遼河公園水上被困群眾

5月6日·武漢要聞及抗擊肺炎快報

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

相聲界的顏值擔當張雲雷稱號大揭祕

美國百年薅羊毛攻略

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

新款iPad mini5蜂窩版：7.9寸視網膜屏+A12仿生芯片售價3896元起

聚飛光電——Mini LED龍頭小漫步者

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患