教你編寫一個機器學習代碼也能使用的單元測試技术頭條網

2018-07-05 19:54:40 雲棲社區

摘要： 想不想節省重新訓練數據的時間？想不想讓你的研究成果有個質的飛躍？來看看這些單元測試，助你一臂之力。

注：這篇文章自從發佈出來，就受到讀者的好評和關注，因此，我編寫了一個機器學習測試庫！

在過去的一年裡，我花了很多時間來研究深度學習，並且也犯過很多錯誤，這些錯誤不僅幫助我對機器學習有了更加深入的理解，也讓我學會了如何正確合理的設計這些系統。在Google Brain工作期間，我學到了很多設計原則，其中之一就是單元測試可以制定或打破原有的算法，並且能夠節省數週的調試和訓練時間。

然而，到目前為止，似乎還沒有為神經網絡代碼編碼測試單元的比較可靠的教程。即使是在OpenAI上，也只是通過一行行的盯著代碼來發現bug，然後再思考導致這一bug的原因到底是什麼。顯然，大部分人都不願意這麼耗費時間，因此，我希望看完這個教程，你就可以開始著手測試你的系統！

我們從一個簡單的例子開始：試試在這段代碼中找到bug。

有找到bug嗎？實際上，這個神經網絡並沒有進行堆疊。我在編寫代碼的時候，只是對slim.conv2d（...）代碼行做了簡單的複製粘貼，然後對內核大小進行修改，而並沒有實際的輸入。

略微尷的來說，這其實是我上週編寫的代碼……這也是個很重要的教訓！但是由於某些原因，這些bug很難被發現：

1.這段代碼永遠不會崩潰，或者引發錯誤，又或者是運行速度變慢。

2.這個神經網絡仍在訓練，並且損失函數會越來越小。

3.幾個小時後，會收斂到某一數值，結果非常糟糕，但是，你又不知道應該修改哪裡。

當唯一的反饋只有最終那個錯誤驗證時，那麼，你只有一個辦法——就是搜索整個網絡架構。不用再多說了，你需要的是一個更好的網絡系統。

在我們對數據進行了一整天的訓練以後，該如何發現這一bug呢？我們發現，最容易注意到的是，層的值實際上從未到達函數外的任何其他張量。因此，假設我們有某種類型的損失函數和優化器，這些張量永遠都不會得到優化，它們將始終保持為默認值。

通過簡單的訓練，我們來比較訓練之前和訓練之後的結果：

在這不到15行的代碼中，我們基本上驗證了訓練過的所有的變量。

這個測試非常簡單、實用。現在，假設我們已經修復了上一個問題，現在，添加一些批量優化，看看是否能發現這一bug。

看到了沒？這個非常微妙。在tensorflow中，batch_norm實際上將is_training默認為False，所以添加這行代碼並不能在訓練期間將輸入規範化！值得慶幸的是，我們編寫的最後一個單元測試將會立刻找到這個問題！

我們來看看另外一個例子，來自於reddit的一個帖子：該作者想創建一個分組器，其輸出範圍為（0,1），你是否能夠找出其中的bug？

這個bug很難發現，並且稍不注意就會導致特別混亂的結果。基本上，這個預測只有一個輸出，當你使用softmax交叉熵時，總會導致損失函數為0。

測試這段代碼最簡單的方法就是——確保損失函數永遠不為0。

這個測試類似於我們的第一個測試，唯一不同的就是回退。在這個測試中，你可以確保只訓練你想要訓練的變量。拿生成對抗網絡來（GAN）說，常常出現的bug就是忘記在優化期間訓練了哪些變量，類似這種的bug經常會發生。

這其中最大的問題就是：優化器有一個默認設置來優化所有的變量。對於類似於對抗生成網絡的架構來說，這是對所有訓練時間判了一個死刑。在這裡，使用下面的測試代碼，你就可以輕鬆檢測到這些bug：

同樣，我們也可以為鑑別器或其它強化學習算法編寫類似的測試代碼。很多演員－評論模型都有自己相對獨立的網絡，需要通過不同的損失進行優化。

為了你在閱讀完本文後，能夠更好的進行測試，我認為以下幾個建議很重要：

1.保證測試的確定性。如果你真的想要隨機輸入數據，那麼，請確保輸入的隨機性，以便於輕鬆的完成測試。

2.保證測試的簡短性。一定要有能夠訓練收斂並檢查驗證集的單元測試，否則你就是在浪費時間。

3.確保在每次測試前重置圖表。

總之，還會有很多測試方法可以測試這些算法。花一個小時的時間來編寫一個測試代碼，不僅可以幫你節省重新訓練的時間，還能夠大大改善你的研究成果！

以上為譯文。

本文由阿里云云棲社區組織翻譯。

分享到:

閱讀更多 雲棲社區 的文章

關鍵字: 很多單元測試技術

教你編寫一個機器學習代碼也能使用的單元測試

相關文章:

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Redis內存分析工具--rdr安裝與使用

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

一行代碼提升遷移性能

利用相似幾何信息，做可泛化3D形狀分割模型

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

分佈式緩存，真香

特徵工程的力量

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

SpringBoot如何優雅的使用RocketMQ

css代碼規範工具stylelint

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪