![圖像質量預測的特徵提取](http://p2.ttnews.xyz/loading.gif)
你會如何對手機圖庫中模糊,暗淡和嘈雜的圖像做出反應?刪除那些質量差的圖片?或者讓他們實現您的存儲?
如果我們可以自動選擇質量較差的圖像同時刪除它們,這將非常有用。
從商業角度來看,想象用戶必須經歷一堆質量不好的圖像(他們無法擺脫),他們會不停地滾動屏幕?
![圖像質量預測的特徵提取](http://p2.ttnews.xyz/loading.gif)
基本上,我們不太可能點擊一些不感興趣的東西。從良好的意圖出發,通過為買家提供良好的體驗讓買家滿意,上市銷售的可能性也會增加。
不可避免地,質量差的圖像數量非常大。我們需要一個可以解決這個問題的自動化系統。
計算機視覺和機器學習的結合在使用MNIST數據集的數字識別, 圖像識別直到面部情緒檢測方面有一些進步 ,但很少討論用於確定圖像質量的模型。
圖像的質量充滿了主觀性,但我們相信每個決定都有“灰色區域”和幾乎每個人都對應的另一個區域。我們嘗試捕獲該區域以構建模型以確定圖像質量。
“基本上,所有模型都是錯誤的,但有些模型很有用”--George EP Box
我們根據人眼判斷圖像的方式以及計算機可以處理與圖像質量相關的圖像來開發模型。
由於計算機將圖像看作數百萬個單獨的像素,每個像素都有顏色和alpha值,我們使用opencv和python從像素中提取多個指標,用於機器學習模型特徵。Github中提供了特徵提取的代碼
功能包括:
1.紅色,綠色,藍色和灰度值的均值和方差
第一組特徵是圖像的紅色,綠色,藍色和灰度值的均值和方差。灰度值是從RGB值與公式的線性組合獲得的Grayscale = 0.30R + 0.59G + 0.11B 。我們認為灰度值的平均值是圖像的亮度或亮度。
2.不同的像素率
根據不同像素的數量除以圖像的大小來計算不同的像素速率。該指標可以告訴我們圖像背景的平坦程度或模糊程度,可以區分彩色圖像。
3.對比
對比度是使對象(或其在圖像或顯示器中的表示)可區分的亮度或顏色的差異
4.飽和度
飽和度 是指圖像中的顏色強度。為了獲得該值,我們只需將RGB值格式轉換為圖像的HSV值格式。
5.模糊
可以通過圖像的拉普拉斯核的變化來計算模糊。
6.銳度
清晰度由不同色調或顏色的區域之間的邊界定義。我們根據灰度圖像的梯度計算銳度。
從整體形象判斷是不公平的
考慮這張照片
這是一個散景圖像,具有良好的質量,但如果我們計算模糊,它將被視為質量差的圖像。具有對比背景的圖像的相同示例。為了解決這個問題,我們嘗試將圖像切割成3x3部分,結果比以前好多了。
我們使用9個部分的圖像和整個圖像功能來加工學習模型。我們比較了幾種模型,最終測試數據的準確度為82%(標籤為0表示不良,1表示良好)。
通過自動了解圖像質量,我們可以實現自動圖像增強器的推薦,或者只要用戶上傳照片就給用戶提供圖像質量的分數。
我們相信圖像質量檢測是增加應用程序參與度和列表流動性的最關鍵因素之一。