目標檢測實戰項目「代碼實戰篇」

佚名

2021-04-05 21:16:03

深度學習的三駕馬車：數據、模型、算力。本文將從這三方面，實現 YOLO 目標檢測，讓自己的數據跑起來

數據

一個深度學習項目最好的初始狀態是擁有漂亮的數據，但是一般情況下很難達到這種條件，往往需要根據自己項目的需求尋找相應的數據。對於目標檢測項目來說，漂亮的數據應該是按照規範的標註。那麼有數據卻沒有標註怎麼辦，我們推薦一款開源的標註工具 LabelImg ，有著方便的 GUI 界面，可以方便打開一個文件夾，對相應的圖片做標註，標註完成以後，支持 PascalVOC 或者 YOLO 格式導出，非常的方便。

Labelimg

該項目開源在： https://github.com/tzutalin/labelImg

想嘗試一下本項目，苦於沒數據怎麼辦？有數據不想標註，想看一下本項目的效果怎麼辦？這都不是問題，文末聯繫我，為你準備了兩份數據！

模型

目標檢測分為 Two-stage 和 One-stage 顧名思義就是兩步完成還是一步完成（發展歷程就是從 Two-stage 到 One-stage 的過程）

One-stage 和 Two-stage 各有千秋，One-stage 因為沒有候選框生成步驟，所以速度會更快，速度更快意味著喪失了部分的精度，Two-stage 因為有候選框的選取過程，所以精度會更高，喪失部分精度，果然是魚與熊掌不可兼得。

常見的 One-stage 算法有 OverFeat、YOLOv1、YOLOv2、YOLOv3、SSD 和 RetinaNet 等。

本文以 YOLOv3 為主要實踐對象，一步一步通過開源的項目，使用 YOLOv3 訓練自己的數據（完整的項目會在文末放出）

數據準備

巧婦難為無米之炊，沒有數據，再優越的模型也無用武之地。

如果自己有原始的數據，但是沒有標註，就可以使用 Labelimg 進行標註，輸出的結果是一個 xml 文件。大致的文件結構如下：它包含的信息有圖片的高寬通道數各個目標在原始圖片的位置以及標籤。

xml 文件

如果你已經有了標註的數據，就可以根據 xml 文件生成一個 txt 文件來進行訓練，txt 文件的格式如下：第一個值代表類別標籤的索引，後面四個值是原始圖片上目標折算後的數值，我們就是根據這些數據來訓練模型。

txt 數據文件

生成後可以用一下公式對轉換前後的數據進行簡單的驗證，保證數據的準確性（具體的折算過程可以看文末的參考資料）：

生成的 txt 內容如下（舉例一條）： label 可以用以下公式簡單驗證一下生成的 txt 和與原始的 xml 文件是否轉換正確：其中 label 是類別在 data/custom/classes.names 的索引, <> 代表縮放後的比例係數 *w = (xmax-xmin)/2 + xmin *h = (ymax-ymin)/2 + ymin = (xmax-xmin)/w = (ymax-ymin)/h

對於如何根據 xml 標註文件生成 txt 數據文件，我們這邊有份參考腳本可以幫助你：

閱讀 readme.md 中的內容，按照 1、2、3、4 腳本運行，保證你啥問題都沒有

│ 1_init.py │ 2_createID.py │ 3_trans.py │ 4_to_train_val_txt.py │ classes.names │ readme.md │ train.txt │ valid.txt │ ├─images │ train.jpg │ └─labels train.txt YOLOv3 模型搭建

我們先來看一下 YOLO 的設計流程，對整個項目的大局有一定的掌控

配置數據文件

classes= 1 # 目標檢測的類別數量，有多少類就設置多少類 train=data/custom/train.txt # 訓練集的圖片名稱，放在 train.txt 文件下，每一行是一張圖片的名稱 valid=data/custom/valid.txt # 訓練集的圖片名稱 names=data/custom/classes.names # 每個類別的名字，一行一個模型初始化

YOLOv3 使用的是 Darknet53 的結構，是一個全卷積的模型，可以擁抱任何大小的輸入，但是必須是 32 的整數倍。Darknet 結果圖如下：

darknet53 結構圖圖片來自互聯網，侵刪

本文使用的深度學習框架是 Pytorch 項目中讀取 Darknet53 模型的方式是通過讀取配置文件，格式如下，並把它加載帶 Pytorch 定義的模型中

Darknet53 配置文件

加載預訓練模型的參數：從預訓練模型開始訓練數據加載器配置訓練模型、保存模型等預測代碼配置演練

接下來我們就開始真正配置我們的參數，實現檢測自定義的數據，先展示一下整個項目的目錄結構

│ detect.py │ detect_2.py # 檢測代碼 │ models.py # 構建模型 │ readme.md │ requirements.txt # 必須的依賴包 │ test.py # 測試代碼 │ train.py # 訓練代碼 │ ├─config # 配置文件 │ coco.data │ create_custom_model.sh │ custom.data │ yolov3-tiny.cfg │ yolov3.cfg │ ├─data # 數據集 │ │ coco.names │ │ get_coco_dataset.sh │ │ │ ├─custom │ │ │ 1_init.py │ │ │ 2_createID.py │ │ │ 3_trans.py │ │ │ 4_to_train_val_txt.py │ │ │ classes.names │ │ │ readme.md │ │ │ train.txt │ │ │ valid.txt │ │ │ │ │ ├─images │ │ │ train.jpg │ │ │ │ │ └─labels │ │ train.txt │ │ │ └─samples │ dog.jpg │ ├─utils # 依賴包 │ │ augmentations.py │ │ datasets.py │ │ logger.py │ │ parse_config.py │ │ utils.py │ │ __init__.py │ ├─weights # 預訓練權重 │ download_weights.sh 安裝依賴

pip3 install -r requirements.txt # 整個項目需要的依賴包 pip install terminaltables 修改配置文件

$ cd config/ # Navigate to config dir # Will create custom model 'yolov3-custom.cfg' $ bash create_custom_model.sh # num-classes 類別數目參數修改數據配置文件

classes= 2 # 類別數 train=data/custom/train.txt valid=data/custom/valid.txt names=data/custom/classes.names 訓練

# 訓練命令 python train.py --model_def config/yolov3-custom.cfg --data_config config/custom.data --pretrained_weights weights/darknet53.conv.74 # 添加其他參數請見 train.py 文件 # 從中斷的地方開始訓練 python train.py --model_def config/yolov3-custom.cfg --data_config config/custom.data --pretrained_weights checkpoints/yolov3_ckpt_299.pth --epoch 測試

# 測試： python detect_2.py --image_folder data/samples/ --weights_path checkpoints/yolov3_ckpt_25.pth --model_def config/yolov3-custom.cfg --class_path data/custom/classes.names

以上就是整個項目的架構思路，如果你還看不懂，沒關係，貼心的我為你們準備了詳細的文檔說明，並在部分代碼處加了詳細的解釋

本項目已經開源在：

https://github.com/FLyingLSJ/Computer_Vision_Project/tree/master/Object_Detection/yolo_demo/PyTorch-YOLOv3-master

訓練步驟文檔：

訓練步驟文檔

數據集準備步驟文檔

以下是該代碼在某數據競賽平臺獲得的成績，該比賽是對是否有戴安全帽進行檢測，其中有些數據是在教室進行採集的，以下的成績說明，YOLO 對小目標和密集的目標檢測效果並不好

本代碼排名

其中前 3 名排名如下：

大佬排名

算力

以上說完兩駕馬車了，還有一駕算力馬車，目標檢測對於算力的要求相對高點，我用的是下面這臺設備，

用了快 9 個小時

GPU 算力

沒有 GPU 算力跑不動怎麼辦，沒關係，文末聯繫我，送上免費 GPU 算力

結論

沒有數據怎麼辦？沒有模型怎麼辦？沒有算力怎麼辦？聯繫我吧～～～

參考

https://github.com/scutan90/DeepLearning-500-questions/blob/master/https://blog.csdn.net/xiao_lxl/article/details/85342707 VOC 數據格式含義（生成的 txt 數據格式的含義）https://github.com/eriklindernoren/PyTorch-YOLOv3yolo 博客地址：https://blog.paperspace.com/how-to-implement-a-yolo-object-detector-in-pytorch/機器之心翻譯：https://www.jiqizhixin.com/articles/2018-04-23-3yolo 源碼解析：https://zhuanlan.zhihu.com/p/49981816yolo 解讀：https://zhuanlan.zhihu.com/p/76802514

我們用3000km不停歇的方式“檢測”一臺新車

90萬人確診新冠，美國部分州還要復工！難道要靠群體免疫？

緊急通知！從這裡回長寧的人必須申報、檢測！

防禦、檢測、威懾，三種必備的安全策略

0422：虧錢最快的是啥

【關注】檢測！檢測！檢測！重要的事情說三遍！

「公司深度」聚光科技：半導體檢測設備新星，發力高端分析儀器

上海加強來返滬人員健康管理：10月7日至12日抵滬人員免費2次核酸檢測

檢測：電子皮帶秤全部合格

【以案釋法】買保險易理賠難？母親為患病新生兒索賠40萬元遭拒，法院判了

新生兒不幸患病，索賠40萬遭拒，母親將保險公司告上法庭

青島檢測307萬無新增，胸科207人均為陰性，源頭有兩種可能

中國駐赤道幾內亞使館再次提醒在赤幾中國公民做好疫情防控

印度政府擬再採購300萬個快速檢測試劑盒

早讀社丨“五一”出遊怕堵車？快收好這份大數據出行攻略

自測+檢測，危險的頸動脈斑塊離你有多遠

相關文章:

我們用3000km不停歇的方式“檢測”一臺新車

90萬人確診新冠，美國部分州還要復工！難道要靠群體免疫？

緊急通知！從這裡回長寧的人必須申報、檢測！

防禦、檢測、威懾，三種必備的安全策略

0422：虧錢最快的是啥

【關注】檢測！檢測！檢測！重要的事情說三遍！

「公司深度」聚光科技：半導體檢測設備新星，發力高端分析儀器

上海加強來返滬人員健康管理：10月7日至12日抵滬人員免費2次核酸檢測

檢測：電子皮帶秤全部合格

【以案釋法】買保險易理賠難？母親為患病新生兒索賠40萬元遭拒，法院判了

新生兒不幸患病，索賠40萬遭拒，母親將保險公司告上法庭

青島檢測307萬無新增，胸科207人均為陰性，源頭有兩種可能

中國駐赤道幾內亞使館再次提醒在赤幾中國公民做好疫情防控

印度政府擬再採購300萬個快速檢測試劑盒

早讀社丨“五一”出遊怕堵車？快收好這份大數據出行攻略

自測+檢測，危險的頸動脈斑塊離你有多遠

新疆克州阿克陶縣新增15例無症狀感染者 系喀什疏附縣交界鄉鎮隔離觀察人員

美國反興奮劑機構嘗試“自助式”檢測

魚湯熬製的越白越有營養？喝魚湯的常見誤區，為了健康別再犯啦

40頭41元，蝦中又開始找蝦！印度解封白蝦養殖，但仍困難重重

【警方熱線】拉薩市車管所全力確保全市機動車檢測工作有序開展

陸續復學復課，綏寧縣近百名校車駕駛員接受“毒駕”檢測

買保險易理賠難？母親為患病新生兒索賠40萬元遭拒，法院判了

年報一季報業績降幅超七成，超過200家機構扎堆調研這家公司

西亞最大口罩廠投產使用，伊朗將從口罩進口國變為出口國

哈爾濱發佈急尋確診病例交集者通告，將對其進行免費相關檢測

臺灣防疫部門日前公佈的大陸輸入病例核酸檢測結果為陰性

當疫情來到非洲，意味著什麼？

廣州檢測4553名非洲籍人士新冠肺炎病毒核酸：111人呈陽性

黑龍江：為何對入境人員實行“3+1”檢測

印尼新增確診病例349例累計11192例，已死亡845人

今日人心惶惶的新型冠狀病毒到底是什麼？

山西霍州一進口青蝦外包裝檢出弱陽性，涉事場所已臨時關閉

濟南一74歲女性IgM抗體呈弱陽性，官方發佈通告

檢測【大腸菌群】-遠藤改良HiVeg瓊脂（植物源培養基）

宮頸癌那點事

700234確診病例！

戰疫最前沿--02要聞--人民日報海外版--報刊雜誌--版權渠道--首頁

復工、檢測、居家令 特朗普和州長吵不停

​哈爾濱市應對新冠肺炎疫情工作指揮部發布緊急尋人通告

本市單位或個人可自願自費預約進行核酸檢測（附檢測受理機構一覽）

“硬核”檢測！國家能源集團大渡河公司引入三維聲吶技術保障大壩安全

廣州越秀：近三天檢測10762例，1例為陽性

廣州荔灣：已完成初三、高三全部學校近3000名教職員工核酸檢測採樣

日本這種錯都能出……

近期全球關於疫情的27條最新消息速遞（全）

廣州檢測4553名非洲籍人士新冠肺炎病毒核酸 111人呈陽性

檢測

保養檢測了一天的車子，此刻華燈璀璨…

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

當我們在談 SaaS 的時候，在談什麼？

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

5月西安招聘會時間安排來了！找工作的別錯過

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

“幫助當地居民解決用水難題”-今日頭條-手機光明網

灌籃高手無水印壁紙，每一張都是回憶

通遼藍天救援隊成功解救遼河公園水上被困群眾

5月6日·武漢要聞及抗擊肺炎快報

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

相聲界的顏值擔當張雲雷稱號大揭祕

美國百年薅羊毛攻略

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

#戰疫必勝#“症和狀”都有了，我與新冠擦肩而過

新疆克州阿克陶縣新增15例無症狀感染者系喀什疏附縣交界鄉鎮隔離觀察人員

復工、檢測、居家令特朗普和州長吵不停

哈爾濱市應對新冠肺炎疫情工作指揮部發布緊急尋人通告

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患