人工智能數據標註之圖片標註基礎教程

隨著人工智能行業的發展,數據做為人工智能的底層支撐資源,也逐步的規模化生產。可思數據近期整理了一些數據標註的操作流程也希望行業內的標註員能更好的掌握這項技能。


項目簡介:圖片標註是人工智能領域的前期基礎工作,人工智能機器人需要學習大量帶有屬性標籤的圖片來增強對物體的識別能力,比如識別人是男人、女人、老人、嬰兒、年輕人、中年人,識別人臉特徵,識別各類動物,識別交通工具和道路狀況等等,從而讓機器人變得越來越智能,而圖片標註工作就是需要大量專業標註員來給各種類型的圖片進行拉框標註的一份工作。圖片標註工作非常簡單,按規則對圖片進行標註即可,工作時間相對靈活,不侷限於上班下班規定時間。

適合人群:圖片標註工作適合所有在家工作的人群,殘疾人(聽力殘疾、下肢殘疾、語言障礙)、殘疾人家屬、全職媽媽、大學生、待業人士,以及其他待業在家人士。因工作的特殊性,大多數情況需要對色彩進行識別,所以不適合視障、色盲、色弱人士。
工資結算:標註報酬一般按圖片張數或框數來進行計酬,標註員每天工作收入約為100-200元之間,標註量多少跟圖片標註的難度和熟練程度有直接關係,單價也因難度不同有較大的區別,項目啟動之前主管老師都會公佈標註價格。項目週期一般是數天到數月不等,工資發放時間一般在項目結束之後客戶對互幫標註團隊標註數據進行質檢,達標後給予結算,互幫在收到款項後即會立即給標註員進行發放。

一、標註基礎規則(此規則為行業普遍使用的規則,但項目不同可能規則略有不同,標註工作前主管會發放最新規則給標註員):
1、貼邊規則:需緊貼目標物體的邊緣進行拉框,不可框小或框大。
正確案例:


人工智能數據標註之圖片標註基礎教程


錯誤案例一(框太大):


人工智能數據標註之圖片標註基礎教程


錯誤案例二(框太小):


人工智能數據標註之圖片標註基礎教程


2、折中規則:適合大面積的的不規則的圖片,比如藍天、沙灘、草地等大面積的目標出現斜度的時候,即把框和目標物交叉點居中即可。(圖例如下)
正確案例(框進去的山和沒框進去的藍天面積差不多大即可):



人工智能數據標註之圖片標註基礎教程


錯誤案例:


人工智能數據標註之圖片標註基礎教程


人工智能數據標註之圖片標註基礎教程


人工智能數據標註之圖片標註基礎教程


3、重疊規則:當兩個目標物體有重疊的時候,只要不是遮擋超過一半的就可以框的,允許兩個框有重疊的部分。如果其中一個物體擋住另一個物體一部分,框的時候就需要對另一個物體的形狀進行腦補完整然後框起來即可。
正確案例(男孩的腿需要腦補出完整形狀後框進來):


人工智能數據標註之圖片標註基礎教程


錯誤案例(男孩的腿未框進去):


人工智能數據標註之圖片標註基礎教程


4、獨立規則:每一個目標物體均為單獨拉框,比如5個人一起合影不能只拉一個框,而是要單獨將5個人都分別拉框。
5、不框規則:目標物體太小的不框,被遮擋嚴重的不框(一般被遮擋超過一半以上的不框),缺損嚴重的不框,模糊不清的不框,太暗和曝光過度的不框,目標數量多的實在沒辦法框的不框,不符合項目特殊規則的不框。


二、標註軟件使用教程:
1、標註軟件LabelImg是最常用的圖片標註工作和訓練軟件,標註軟件下載地址:
http://data.sykv.com/tool/33.html (注意,本軟件只支持win7及以上系統,不支持XP系統,想做的請升級到win7系統即可)
2、下載後將軟件壓縮包“windows_v1.5.1.zip”解壓到電腦桌面上,無需安裝,直接打開“labelImg”程序便可進入標註界面,軟件是英文版,但操作極為簡單,常用功能都做了中文註解。(點擊下圖即可放大看)

人工智能數據標註之圖片標註基礎教程


3、將“圖片標註考核文件”的文件夾下載到電腦裡(下載地址:
http://data.sykv.com/tool/33.html),然後解壓到電腦桌面。
4、點標註軟件中的“Open dir”(打開文件夾),找到“圖片標註考核文件”點“選擇文件夾”,圖片即顯示在圖片標註工作區中。
5、然後點“Create Rectbox”(畫框)對圖片中的目標物進行畫框,在彈出的標籤彈窗裡將目標物標籤填寫或複製進去即可,本次考核的目標物在下方第三條第2條中紅色的詞即為標籤。
6、標註完一個目標物後繼續按上述方法將圖片內所有的目標物一一標註,標完每張都要保存一下"Save"(或快捷鍵Ctrl+S),再點“Next Image”(下一張圖)繼續標註,全部圖片標註完成後再保存下即可。
三、考核流程說明:
1、本次考核為基礎入門的考核,均為相對簡單的圖片,目的是引導準備加入標註行業的朋友能清晰地瞭解標註的特點和操作方式。
2、本次考核需標註的目標物體為11類(紅色的即為標籤):藍天(可以包含白雲和樹)、沙灘(包括海灘和沙漠)、綠草地(綠色的草地即可)、人行道(斑馬線)、汽車、交通信號燈、人、貓、狗、奶粉、巧克力,拉框後需填入對應的標籤,請標註員儘可能不要漏掉清晰的符合要求的目標物體,如果目標物體太小、太遠、太模糊、遮擋太多的可以不框。


3、將所有“圖片標註考核文件”的圖片全部標註完畢後,在文件夾重命名加上你本人的姓名(例:某某-圖片標註考核文件),不壓縮直接上傳文件夾到百度網盤或微雲,然後把不加密的分享鏈接發送:
http://www.sykv.com/cat/about/contact/,主管老師會逐一檢查點評,考核合格的將會獲得可思數據標註工作長期合作的機會。


分享到:


相關文章: