面對眾多的數據增強技術，你選哪種？這篇“避雷指南”幫你解決！

2018-06-08 18:51:16 AI中國

數據增強是一種與眾不同的創建新“數據”的方法。它有兩方面的優勢，第一是能夠從有限的數據中生成“更多的數據”，第二，它避免了過度擬合。

處理有限的數據有其自身的挑戰，只有當增強技術加強了當前的數據集時，使用數據增強才能產生積極的效果。我們需要思考的是，訓練一個網絡用來“學習”顛倒後的地標是否值得？

然而，如果你的數據集包含處方藥的圖像，那麼有很多方向是有意義的，因為理論上這類圖像的方向是不固定的。

有很多因素會影響結果，例如數據集的大小、增強技術的效果、批處理大小、圖像大小和訓練參數等等。本文的目的是說明數據增強對總體精度的影響。後文的推斷都是基於以下假設：

1.共1040幅火車圖像，選其中208幅進行測試

2.實驗採用Fastai方法

3.訓練採用萊斯利·史密斯單週期法，即短週期內進行高速學習。其中最大動量為0.95，最小動量為0.85，重量衰減為1e-5。目的是在最快的時間內取得最好的結果，以便能夠進行多種不同技術的實驗(以下結果並不顯示所有的結果)。

4.總數有82個不同的標籤,比如說形狀、顏色、標記等等。例如膠囊可以有以下標籤(膠囊)、(藍色)、(TEVA)、(多色)、(白色)、(膠囊形狀)、(25毫克)等。

5.作者沒有上傳的10幅圖像測試了對增強技術的推測，並計算了準確度和誤差率。這是通過檢查正確分類標籤的數量和不準確分類標籤的數量來完成的。大多數論文都關注正確的，但作者還想調查錯誤標籤的數量。

6.結果被分解為1)N：預測的正確標籤總數，2)準確性：(n/82)*100，其中82是標籤總數，3)E：預測的錯誤標籤總數和4)錯誤：(e/N)*100

使用Random Rotate（隨機旋轉）：

變量：以57°的角度隨機旋轉

準確標籤： 55

準確性： 67%

錯誤標籤： 4

錯誤： 7%

使用Dihedral（二面體）：

變量：轉動90度和/或翻轉。

準確標籤： 51

準確性： 62%

錯誤標籤： 9

錯誤： 18%

使用RandomLighting：

變量：設置參數b =平衡和c =對比度隨機調整。

準確標籤： 57

準確性： 70%

錯誤標籤： 12

錯誤： 21%

使用RandomLighting和RandomDihedral：

準確標籤： 52

準確性： 63%

錯誤標籤： 13

錯誤： 25%

使用RandomDihedral和RandomRotate的組合：

變量：隨機二面體與隨機旋轉27度角

準確標籤： 56

準確性： 68%

錯誤標籤： 13

錯誤： 23%

使用RandomZoomRotate：

變量：3個參數

deg =最大旋轉角度，zoom =最大縮放比例，stretch =最大拉伸比例

準確標籤： 62

準確性： 76%

錯誤標籤： 8

錯誤： 13%

使用Padding（填充）

變量：2個參數

pad =頂部，底部，左側和右側的填充大小，mode = cv2填充模式的類型

準確標籤： 54

準確性： 66%

錯誤標籤： 2

錯誤： 4%

使用Cutout（剪貼）

變量：2個參數

n_holes和長度，以便在隨機位置圖像中切出尺寸長度為n_holes的n個孔。這些孔可能重疊。

準確標籤： 41

準確性： 50%

錯誤標籤： 9

錯誤： 22%

結果：

這個項目的目的是要找到最高的精確度和在最短時間內錯誤次數最少(每10次平均訓練時間約為3分鐘)，我們可以看到，通過使用各種數據增強技術，加上單週期訓練方法，可以更好的瞭解到不同數據增強技術適合什麼樣的數據集。

結果表明[RandomZoomRotate]準確標籤更多，[Padding（50）]錯誤標籤最少。同理，[Cutout]選擇的準確標籤最少，[RandomLighting + Dihedral]的錯誤標籤最多。

如果我們將做出正確選擇最多的[RandomZoomRotate]和做出錯誤選擇最少的[Padding（50）]結合在一起，會怎麼樣呢？

變動量：隨機旋轉、縮放與填充

準確標籤： 60

準確性： 70%

錯誤標籤： 6

錯誤： 10%

最後總結

毫無疑問，[RandomRotateZoom]和[AddPadd]（即Padding（50））的組合效果最好。

數據增強對提高準確性，減少誤差方面有著舉足輕重的作用。結果表明，並不是所有的增強都能產生良好的效果，因此，對不同的數據增強技術進行初步實驗可以幫助我們更好的選擇數據增強技術。

分享到:

閱讀更多 AI中國 的文章

關鍵字: 數據增強健康

綿竹市人民醫院：“案例教學法與任務驅動法”拉開了呼吸內科學員培訓序幕

本次培訓充分安排2019年及2020年入科的學員每週固定半天進行集中培訓，主要由帶教組長進行授課，授課內容涵蓋專科理論與專科技能、核心制度等內容，彌補了以往培訓時間不穩定、授課老師水平參差不齊、參培人員不齊全等缺陷，旨在希望新入學員能夠夯實專科理論，熟練掌握專科技術操作等，以勝任

蚌埠“戰疫記”：總有一些堅守讓我們前行

滄海橫流方顯英雄本色，危急時刻盡顯使命擔當。　　在與病魔較量的戰場上，蚌埠有這麼一群人，他們堅守在新冠肺炎疫情防控一線，為了大家歲月靜好，舍小家負重前行，不辭辛勞地與時間賽跑，為群眾築牢“防護牆”。

無償獻血進軍營——熱血湧動雙擁情，680人獻血159700毫升

一個單位是200毫升如果每人獻血200毫升就意味著每天需要140人獻血如果每人獻血400毫升就需要70人也就是說荊門每天需要70—140人成功獻血乍暖還寒，當4月11日的第一縷陽光照亮天邊時，荊門市紅十字中心血站的獻血車也開進了駐荊某部隊的營地。

返崗第一天干勁滿滿！363醫院援湖北醫護迴歸生活正軌

本次363醫院援助湖北醫療隊的隊長秦克醫生也在今天結束休假，迅速地回到了工作狀態，雖然前段時間人不在醫院，但他和劉護士長一樣，同樣牽掛著自己的病人，“我們走得時候，走得非常急，當時是凌晨接到命令，然後上午就出發了。雖然我每個病人都進行了一個雙方的交班，但因為病人一般對首診醫生的信

疫苗離我們還有多遠？

疫苗離我們還遠嗎，答案是已經不遠了，在這場沒有硝煙的疫情反擊戰中，施行“早發現，早隔離”，是阻斷疫情傳播的關鍵。

你知道茶有多少類嗎？快來看看把

很多人喝了那麼多茶，面對茶的類別，還是一知半解。對於六大基本茶類：綠茶、白茶、黃茶、烏龍、紅茶、黑茶。

大蒜的還有這麼重要的功效，請注意多吃遠離三高

說起大蒜，想必大家都很瞭解，是咱們廚房中必備的一種調味品。大蒜頭下羊肉粉是許多人的心頭好，雖然吃大蒜頭會引起口氣，但它共同辛香鮮辣味仍讓大蒜頭廣受歡迎。

都認為方便麵是垃圾食品，其實這3種食物，儘量少吃多吃也不健康

我們都知道，方便麵使我們日常生活中非常非常常見的，很多時候我們不想做飯的時候都是一番便面充飢。當然，方便麵吃起來確實挺方便的，味道當然也不錯。

喝不同得茶有不同得好處，適合自己喝得茶才是好茶

品茶即是品得生活，也是品得健康六大基本茶類：綠茶、白茶、黃茶、烏龍、紅茶、黑茶。綠茶通常被認為有防癌、降血脂、降血壓、減肥等作用。

為什麼有人吃苦瓜胃疼?一定要引起重視

我們吃了這道菜之後，就感覺肚子不舒服，不知道是什麼原因，這個過程中，我們除了喝了些酒之外其他的也沒有，以往吃這種菜也沒有這種感覺，就查了一下度娘。

ACC中國之聲丨霍勇教授：中國三級醫院急性冠脈綜合徵患者的血脂管理——DYSIS II ACS China研究解讀

▼參考文獻1.Huo Yong1 Xuan Li2 et al. Lipid Management in Acute Coronary Syndrome Patients Among the Tier 3 Hospitals in China: D Yanjun Gong1

他汀類藥物的“肌痛困局”，讓基因來破

作者：承啟醫學作為心腦血管病患者的必備藥物，洛伐他汀、辛伐他汀、普伐他汀、氟伐他汀、阿託伐他汀、瑞舒伐他汀等他汀類藥物正被越來越多的人知曉。隨著人口增長和老齡化加劇，自2005年始，心血管疾病已成為非傳染性疾病的首要死因。

ACC.20丨循環前哨，調脂治療前沿探索-權威專家縱橫談（四）

2020年4月2日晚，由北京安貞醫院周玉傑教授主持，邀請國內共18位權威專家共同就ACC2020最新進展，從結構性心臟病、介入治療、抗栓治療、血脂治療、腎動脈消融治療高血壓五大方面進行了深刻解讀、深入討論。

海口有效的治療白癜風的方法有哪些

海口有效的治療白癜風的方法有哪些？　　白癜風的治療方法可包括有三種，分別是手術治療、激光治療和藥物治療。

蛀牙殘冠殘根不處理，當心口腔癌

當殘冠殘根長期遺留在口腔內，其尖銳的邊緣會對口腔黏膜造成慢性刺激，出現創傷性口腔潰瘍，對於這種潰瘍，如果能及時處理，採取拔除或其他正確處理措施，口腔潰瘍會很快癒合。

穀雨時節，喝什麼茶養生？

“清明斷雪，穀雨斷霜”，我們走過乍暖還寒時候，迎來雜花生樹的暮春。此時，雨水充沛、溼氣聚集、陽氣升發，養生之法亦需因時而變，可以茶驅腥氣、以茶防病氣、以茶養生氣。

裝支架前後，家屬該做什麼？

如果患者是突發心梗，冠狀動脈完全閉塞，需要儘快開通動脈，若所在醫院具備介入手術的條件，應馬上手術，否則應考慮由120轉院或接受溶栓治療；如果是穩定性冠心病患者，檢查發現冠狀動脈存在狹窄，此時需要評估動脈狹窄與心肌缺血的關係，以確定是否需要進行介入治療。

海口白癜風專家科普:白癜風患者生活小常識有哪些

在生活中也是有一些關於白癜風的小常識的，接下來就由海口專家介紹一下。所以，如果白癜風患者的發病率，或在多個不同大小，形狀不一，白斑皮膚。

瞭解白癜風專業治療期間要注意什麼

白癜風發病會出現白斑的症狀，發病在患者的皮膚上患者要重視的就是要積極治療，一些人都是到正規的醫院進行正規的治療的，這個對治療就是有很好的效果了，那麼，白癜風專業治療期間要注意什麼呢？

NEJM丨無症狀比例達87.9%！紐約長老會艾倫醫院孕產婦新冠病毒檢測

2020年4月13日，哥倫比亞大學歐文醫學中心/紐約長老會艾倫醫院的DesmondSutton等人發表在《新英格蘭醫學雜誌》上的一篇CORRESPONDENCE中稱，該院對215名孕產婦進行新冠病毒PCR檢測結果顯示，有15.3%的孕婦呈陽性，且87.9%的確診患者沒有表現COV

綏芬河入境病例12天呈兩位數增長，在俄公民回國需申報健康狀況

4月15日，中國駐符拉迪沃斯託克總領館通報稱，通過莫斯科-符拉迪沃斯託克-綏芬河路線輸入黑龍江省的新冠肺炎確診病例累計已達332例，均為中國籍。南都記者梳理發現，從綏芬河口岸入境的確診病例已經連續12天兩位數增長。

國家衛健委：昨日新增確診病例46例，其中10例本土病例

4月14日0—24時，31個省和新疆生產建設兵團報告新增確診病例46例，其中36例為境外輸入病例，10例為本土病例；新增死亡病例1例；新增疑似病例11例，其中10例為境外輸入疑似病例，1例為本土疑似病例。

解放軍總醫院呼吸科專家劉又寧表示：臨床發現個別健康人攜帶病毒

•即核酸檢測為陽性，但沒任何症狀，且多次血檢抗體呈陰性•這意味著人體攜帶病毒卻不將其消滅，僅作為宿主傳染他人受訪專家：大連市中心醫院呼吸內科主任醫師劉春芳4月6日，解放軍總醫院呼吸科專家劉又寧在接受採訪時表示，嚴格來說，新冠病毒核酸檢測陽性並不證明被感染了，抗體檢測陽性才能說明。

全球確診突破百萬，更可怕的是：8年前就被一位女作家“預言”了

比全球疫情蔓延更可怕的是，“突發瘟疫、城市封鎖、民眾出逃、搶購成風……"今天所發生的一切，8年前就被一位女作家“神預言”了！

黑龍江新增確診病例8例，新增境外輸入確診病例14例，活動軌跡公佈↘

據黑龍江省衛生健康委員會——2020年4月14日0-24時，黑龍江省省內新增確診病例8例，無新增疑似病例。

為什麼肝癌如此偏愛中國人，讓1億多國人談它色變？

本文首發於微信公眾號：Eman邇文基因（ID：emangene）中國是名副其實的肝癌大國。肝癌處於中國惡性腫瘤死亡率第 2 位，腫瘤發病率第 3 位。根據世界癌症研究組織調查的結果，2018年有超過84萬肝癌新病例，而中國的肝癌患者佔據全世界肝癌患者的50%以上。

4月14日廣州市新冠肺炎疫情情況

4月14日廣州市新冠肺炎疫情情況4月14日0時至24時，廣州市報告新增確診病例2例，均為境外輸入關聯病例。

瑞德西韋中國兩項臨床試驗“叫停”

同時，瑞德西韋中國輕度和中度症狀組的臨床試驗的最新狀態也已更新為“暫停”，意味著臨床試驗提前結束，但是未來有可能重新開啟。

外籍新冠肺炎患者醫療費如何支付？四部委發佈通知

詳見下文↓國家醫保局外交部財政部國家衛生健康委關於外籍新冠肺炎患者醫療費用支付有關問題的通知一、各地有關部門要在當地應對疫情工作領導小組的領導下，密切配合，實時掌握外籍新冠肺炎患者有關信息，按規定做好救治工作和醫療費用結算。

關於疫情，在前人的詩歌中，有這些記載

庚子年春，一場由新型冠狀病毒引起的肺炎疫情在國內瀰漫開來，讓人們談疫色變，好在現在形勢好轉，疫情得到較好的防控。

普通人如何正確保護自己？專家迴應來了！

2月3日晚，湖北舉行第十三場疫情防控例行發佈會，三位國家衛健委專家組成員介紹了相關情況。他們分別是中國工程院院士、天津中醫藥大學校長張伯禮，東南大學附屬中大醫院副院長邱海波，北京地壇醫院感染二科主任醫師蔣榮猛。

濟南無新增，山東無新增

2020年2月26日0時-12時，濟南市無新增新型冠狀病毒肺炎確診病例及疑似病例。截至2020年2月26日12時，濟南市累計報告新型冠狀病毒肺炎確診病例47例，治癒出院24例，現有病例均在定點醫療機構隔離治療。

櫞在愚舍：腎陽虛導致的冬季怕冷應該如何緩解？

圖片來源：網絡前一篇文章說了腎虛分為腎陰虛和腎陽虛，腎陽虛可能導致手腳冰涼、怕冷、精神差、容易疲倦，今天說說如何通過補腎養腎來緩解冬季怕冷。前面也說了中醫認為腎主藏精、主水，冬季屬水、主封藏，因此冬季是非常應該養腎的。

櫞在愚舍：手腳冰涼又易累，可能和腎陽虛有關

圖片來源：網絡隨著冬季的來臨，不少人出現了手腳冰涼、怕冷、精神差、容易疲倦的情況，甚至有些人在晚上睡覺的時候很久都睡不暖，只能多穿衣服、多待在溫暖的室內，殊不知這可能是身體在提醒你，該養腎了。圖片來源：網絡中醫認為：腎的主要生理機能是主藏精，主水，主納氣。

遼寧省新型冠狀病毒相關檢測價格項目公佈

【戳↑↑↑圖片查看更多】為加強新型冠狀病毒核酸檢測，近日，省醫保局、省衛生健康委聯合下發的《關於臨時設立新型冠狀病毒相關檢測價格項目的通知》中明確，屬於我省各地指定的允許開展新型冠狀病毒相關檢測的公立醫療機構臨時設立“新型冠狀病毒核酸檢測”和“血清新型冠狀病毒抗體檢測”醫療服務項

新冠患者康復後會反覆或再感染？這份新冠抗體研究值得細讀

近日，復旦大學附屬上海公共衛生臨床中心、復旦大學基礎醫學院病原生物系及醫學分子病毒學教育部/衛生部重點室的研究團隊在預印本網站醫學預印版網站medRxiv上發表了題為“Neutralizingantibody responses to SARS-CoV-2 in a COVID-

【個人防護】警惕！兩女子肺部CT全是白色，只因天天做這件事！家裡都有

近日，張女士和王女士患了同一種“病”，均因頭暈、乏力到醫院就診，但並沒有出現發燒及咳嗽、咳痰、呼吸困難等症狀。不過，她們的胸部CT結果卻嚇人一跳！↑↑張女士肺部CT王女士肺部CT肺部CT均呈毛玻璃影難道是……新冠肺炎？管床醫師李鳳芝反覆追問病史，兩位均無流行病學史，隔離病區主任張

國家藥監局開展應急審評審批，對接科研攻關，保障防疫用藥

一是第一時間啟動應急審批工作機制，既堅持依法依規，又做到特事特辦，確保應急審批科學精準、規範有序和高效。

劃重點！鍾南山肯定中藥對新冠作用

【購房資訊輕鬆享，快來關注樂居網】文章來源:新浪樂居優質內容推薦五線城市房價已大幅下跌，房地產泡沫破裂或由此開始臨汾市區一重點學校建設，傳來新進展 4月14日，寧波這2條高速封閉相應車道

面對疫情，有種藥叫做（中藥）！

新冠肺炎肆虐全球，相比起意大利等國，中國死亡率低，中醫藥被視為抗疫功臣。參與抗疫的專家表示，中醫藥治療能降低死亡率，緩解患者症狀，減少輕型、普通患者轉為重症患者。

3個新冠病毒疫苗獲批進入臨床試驗，振奮人心。

目前已有3個疫苗獲批進入臨床試驗，腺病毒載體疫苗成全球首個啟動二期臨床研究的新冠疫苗品種科技部社會發展科技司司長吳遠彬介紹，目前已有3個疫苗獲批進入臨床試驗，其中陳薇院士團隊的腺病毒載體疫苗首個獲批進入臨床研究，已於3月底完成了一期臨床試驗受試者的接種工作，並於4月9日開始招募二

專家走進32所學校，防控先行指導開學

全市高三年級開學首日，市衛健中心的14名專家再次走進部分中學進行一線相關指導，確保學校安全有序復課。

浦城集中隔離醫學觀察點工作人員在抗“疫”中弘揚廖俊波精神

來源：閩北日報“謝謝你們提供的保姆式服務，謝謝你們！”近日，浦城縣的密切接觸隔離觀察人員和境外返鄉人員，在解除集中隔離醫學觀察後，對這裡的工作人員特別是醫護人員提供的暖心服務紛紛點贊。

青春痘與內臟的關係，六大原因影響你的臉，長痘痘的你知道了嗎？

對於營養醫學有著深入的興趣和研究，希望可以通過文字的分享幫助到大家。因臉上長痘被認定為不合格；知名化妝師為“痘”辭職；公司以長痘為由辭退女員工；餐廳服務員因長痘被辭退。

很多人早起口乾口苦是什麼原因？秋季養生小妙招，養生實惠效果好

老年痴呆人數逐年攀升，你和健康長壽差了幾步？學會輕鬆用入生活

惡性腫瘤很“難得”，三大檢查症狀別大意，一旦發現就可能晚期

多年的失眠此法調理有望，看懂四大因素對症下藥，找對病因是關鍵

齊齊哈爾一品醫聯醫學檢驗實驗室核酸檢測指南

按照齊齊哈爾市應對新型冠狀病毒感染肺炎疫情工作指揮部指示，齊齊哈爾一品醫聯醫學檢驗實驗室在齊齊哈爾市中醫醫院南院作為定點新型冠狀病毒感染肺炎檢測醫療機構；並面向社會及其他醫療機構提供核酸檢測、抗體檢測服務，有自願檢測需求的市民需提前預約。

五一去哪兒旅遊最安全？李蘭娟院士這樣說

對此李蘭娟表示，無症狀感染者本身不可怕，重要的還是要做好檢測、讓情況不明的人變得“明”起來。“無症狀感染者是隱性感染，也可能是發病的前期，有些過幾天可能症狀就出來了，這種不可怕，症狀出來了我們就能夠發現它，還有些沒有症狀最後好了、可以產生抗體了，所以無症狀感染者本身沒有什麼，就怕