產品經理也能動手實踐的AI（二）- 做個識別寵物的AI 技术頭條網

2019-03-29 08:31:54 增長浩克

上一篇，介紹了為什麼選擇FastAI，為什麼適合產品經理，為什麼值得學習這項技能。而寫這篇文章的目標是，看完了之後可以更好的看懂教程中的內容。

概覽

直接上例子，核心代碼一共3行：

data = ImageDataBunch.from_name_re(path_img, fnames, pat, ds_tfms=get_transforms(),size=224) learn = cnn_learner(data, models.resnet34, metrics=error_rate)learn.fit_one_cycle(4)

識別準確率是94.3%，在2012年，寵物識別的準確率才59%

核心步驟

創建圖像數據 databunch object
創建學習對象 learn object
開始訓練 fit one cycle
調試
保存之前的模型
數據糾錯
找到學習率
重新訓練

前3個就是訓練一個神經網絡必要的代碼，而之後的那些都是從各個角度去發現問題，然後提高準確率。

這裡還有幾個重要概念：

遷移學習 transfer learning：類似於大師已經提供了一套學習方法，我們在這基礎上訓練自己的學習方法；
錯誤率 error rate：就是驗證組數據，預測錯誤的百分比；
損失 loss：我形象的稱為打臉指數，就是越自信，但是卻預測錯誤，那loss就高
驗證組 validation set：數據一般分為訓練組和驗證組，驗證組就是用來驗證訓練好的模型的準確度，驗證組的數據是AI沒有見過的數據；
過度擬合 overfit：有點類似於牛肉吃多了，吃什麼都覺得像牛肉味……我舉不出更好的例子了，有想法記得給我留言；
學習率 learning rate：就類似於1個字1個字讀→一個個詞讀→一句句話讀，1個個字讀就屬於小的學習率，比較容易發現更細節的特徵點，而大的學習率會發現更宏觀的特徵點；

詳細講解

這節課的重點是跑通一個模型，並且調試到比較好的效果，最終將準確率提高到了95.8%。

Jeremy專門做了很多函數，可以一鍵導入數據，而不是在第一節課就製造N多阻礙，所以只要在Jupyter notebook裡一步步運行就一定可以跑通，但是每一步或者每一個參數代表什麼，是需要在實踐的過程中搞清楚的，前3個核心步驟基本看教程都很容易搞懂，不懂的查找文檔也很好理解。

這裡重點說下調試部分，首先需要保存一下現有訓練的結果：

learn.save('stage-1')

然後可以通過2種方式去調節模型，一是創建解釋器interpretation，找到異常圖片，然後刪掉它（下節課才講如何刪）；二是找到合適的學習率learning rate進行微調fine-tuning。

先看解釋器，提到了2個函數：plot_top_loss 和 most_confused，第一個是把錯的最離譜的圖片都打出來，第二個是把猜錯次數最多的類別給打出來。這樣就非常容易發現問題，比如把出錯次數最多的打出來之後，發現這2種狗確實很接近，人的話也不是特別容易區分，這就可能需要單獨的大量的圖片訓練。

然後是fine-tuning，這裡是重點！！多強調一下，要想微調，就要搞清楚圖像識別的原理，或者叫CNN（convolutional neural network）卷積神經網絡的原理，作者拿出了Clarify的CEO發表的一片通過視覺化理解卷積網絡的論文，詳細介紹了其中的原理。

首先第一層的訓練，屬於學習率特別低的訓練，機器找到了邊緣的規律，發現這幾種顏色的漸變是特別常見的。

然後第二層，基於第一層找到的邊緣，發現這些邊緣的連接，比如直角或者一個弧形是比較有共性的東西。

然後第三層，基於第二層發現的線條，發現了各種形狀。

然後第四層第五層，感覺已經可以識別特定的形狀和特定的物體了，隨著層級的提高，能識別的共性圖像的複雜性也在提高，是因為學習率的提高，機器會選擇性的忽略細節，反而更多的關注宏觀的相似。

第一次訓練用的架構叫做ResNet34，是一個基於上百萬張圖片訓練了34層之後得到的一個通用的圖片識別模型。之前的訓練就是在這個模型之後增加個4個層，訓練之後的結果就已經非常不錯了，如果想變得更好，就只能將之前的模型解凍unfreeze，然後連貫起來重新訓練，並通過

learn.lr_find()learn.recorder.plot()

找到loss和lr的關係

這張圖可以看到當learning rate超過 10-4之後，loss明顯升高，就說明之前默認的0.003的lr偏高了，所以調整lr

learn.fit_one_cycle(2, max_lr=slice(1e-6,1e-4))

至於為什麼調到這個區間，之後的課程會將，而現在就是一個可以充分實踐的機會。

最後得出的準確率94.7%，比之前的94.3%只高了一點點，而95.8%的準確率是通過ResNet50來實現的，因為這個pre-train的模型跑了50層，識別率更高，但非常佔用計算機性能。

好了，草草的把介紹寫完了，很多東西沒法一篇文章寫完，一方面得自己多動手嘗試去感受，另一方面確實有些概念得逐漸理解，希望這篇文章讓你對FastAI運作的模式有了一個清晰的認識。

分享到:

閱讀更多 增長浩克 的文章

關鍵字: 寵物識別人工智能

產品經理也能動手實踐的AI（二）- 做個識別寵物的AI

相關文章:

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

為什麼馬鈴薯不宜過早過遲播種？

疫情愈發嚴重，原油為何反而大漲？

生菜球很好吃，怎麼種植才能高產呢？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？ ？

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

書友們展示一下自我感覺發揮較好的作品，一起學習？

黃金五月份還會漲嗎？

如何看待四月三十號比特幣暴漲突破九千美元？

肖戰粉總是用“這場鬧劇中唯一實名制”這樣的話來洗白，怎麼反駁？

經歷了227和427，你對肖戰的看法是什麼？

你們是願意在老家拿四五千塊錢，還是願意在外地拿六七千塊錢？

多囊卵巢成功懷孕的幾率大嗎？

湖北武漢周黑鴨怎麼做的？

揭露稜鏡計劃的斯諾登，已經逃離美國7年了，現在過得怎麼樣？

Python，Java和前端哪個好學一點？

40萬如何理財會比房貸利率高？

LOL派克再出BUG？“只需一件1100的裝備，就可完成EQ無縫銜接”，你怎麼看？

藥品中標價是給醫院，醫院靠什麼盈利？

英雄聯盟真正能做到攻防一體的是哪個英雄？

圍棋黑方貼目多少最合理？

我的世界除去信仰還只是單純的一個遊戲嗎？

想結婚，但經濟基礎不夠怎麼辦？

如果一個異性每天找你聊天，但是隻是聊工作和生活中的事，他到底怎麼想的呢？

我老婆姐家的孩上技校住我家，整天在手機上看小說不學習怎麼辦？

假如生活讓你暴富一回，你願意平平淡淡過一生嗎？

人到中年如何緩解心理焦慮？特別是在疫情發生存款不多的時候？

律師在大眾眼中是一個什麼樣的形象呢？

如何看待肖戰70後的粉絲？

一些路人是為什麼下場撕肖戰的？

93年的負債將近200萬，怎麼辦？

慫恿同學在校喝酒，導致死亡，有無責任？

母雞抱窩最長時間能抱多少天？期間要注意什麼？

為什麼徐晃要在曹操面前自稱末將？到底要多厲害的將軍才是上將？

為什麼感覺現在的國產電視劇越來越沒啥看的了？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？