機器學習-Faster RCNN的損失函數(Loss Function) 技术頭條網

Faster RCNN的損失函數(Loss Function)的形式如下:

p(i): Anchor[i]的預測分類概率；

Anchor[i]是正樣本時,p(i)*=1；Anchor[i]是負樣本時，p(i)*=0;

什麼是正樣本與負樣本滿足以下條件的Anchor是正樣本：與Ground Truth Box的IOU(Intersection-Over-Union) 的重疊區域最大的Anchor；與Gound Truth Box的IOU的重疊區域>0.7;滿足以下條件的Anchor是負樣本：與Gound Truth Box的IOU的重疊區域 <0.3;既不屬於正樣本又不屬於負樣本的Anchor不參與訓練。

t(i): Anchor[i]預測的Bounding Box的參數化座標(parameterized coordinates)；

t(i)*: Anchor[i]的Ground Truth的Bounding Box的參數化座標；

N(cls): mini-batch size;

N(reg): Anchor Location的數量;

其中，R是Smooth L1函數；

表示只有在正樣本時才回歸Bounding Box。

Smooth L1 Loss

Smooth L1完美地避開了 L1 和 L2 損失的缺陷，在 x 較小時，對 x 的梯度也會變小; 而在 x 很大時，對 x 的梯度的絕對值達到上限1，不會因預測值的梯度十分大導致訓練不穩定。

L(cls): 是兩個類別的對數損失

λ: 權重平衡參數，在論文中作者設置λ=10，但實際實驗顯示，結果對的λ變化不敏感，如下表所示，λ取值從1變化到100，對最終結果的影響在1%以內。

代碼實現

Smooth L1 Loss

def _smooth_l1_loss(self, bbox_pred, bbox_targets, bbox_inside_weights, bbox_outside_weights, sigma=1.0, dim=[1]):

sigma_2 = sigma ** 2

box_diff = bbox_pred - bbox_targets

in_box_diff = bbox_inside_weights * box_diff

abs_in_box_diff = tf.abs(in_box_diff)

smoothL1_sign = tf.stop_gradient(tf.to_float(tf.less(abs_in_box_diff, 1. / sigma_2)))

in_loss_box = tf.pow(in_box_diff, 2) * (sigma_2 / 2.) * smoothL1_sign \\

+ (abs_in_box_diff - (0.5 / sigma_2)) * (1. - smoothL1_sign)

out_loss_box = bbox_outside_weights * in_loss_box

loss_box = tf.reduce_mean(tf.reduce_sum(

out_loss_box,

axis=dim

))

return loss_box

代碼中的Smooth L1 Loss更加General。

bbox_inside_weight對應於公式(1)(Faster RCNN的損失函數)中的p*，即當Anchor為正樣本時值為1，為負樣本時值為0。bbox_outside_weights對應於公式(1)(Faster RCNN的損失函數)中的N(reg)、λ、N(cls)的設置。在論文中，N(reg)=2400、λ=10、N(cls)=256，如此分類和迴歸兩個loss的權重基本相同。

在代碼中，N(reg)=N(cls),λ=1，如此分類和迴歸兩個loss的權重也基本相同。

Loss

def _add_losses(self, sigma_rpn=3.0):

with tf.variable_scope('LOSS_' + self._tag) as scope:

# RPN, class loss

rpn_cls_score = tf.reshape(self._predictions['rpn_cls_score_reshape'], [-1, 2])

rpn_label = tf.reshape(self._anchor_targets['rpn_labels'], [-1])

rpn_select = tf.where(tf.not_equal(rpn_label, -1))

rpn_cls_score = tf.reshape(tf.gather(rpn_cls_score, rpn_select), [-1, 2])

rpn_label = tf.reshape(tf.gather(rpn_label, rpn_select), [-1])

rpn_cross_entropy = tf.reduce_mean(

tf.nn.sparse_softmax_cross_entropy_with_logits(logits=rpn_cls_score, labels=rpn_label))

# RPN, bbox loss

rpn_bbox_pred = self._predictions['rpn_bbox_pred']

rpn_bbox_targets = self._anchor_targets['rpn_bbox_targets']

rpn_bbox_inside_weights = self._anchor_targets['rpn_bbox_inside_weights']

rpn_bbox_outside_weights = self._anchor_targets['rpn_bbox_outside_weights']

rpn_loss_box = self._smooth_l1_loss(rpn_bbox_pred, rpn_bbox_targets, rpn_bbox_inside_weights,

rpn_bbox_outside_weights, sigma=sigma_rpn, dim=[1, 2, 3])

# RCNN, class loss

cls_score = self._predictions["cls_score"]

label = tf.reshape(self._proposal_targets["labels"], [-1])

cross_entropy = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(logits=cls_score, labels=label))

# RCNN, bbox loss

bbox_pred = self._predictions['bbox_pred']

bbox_targets = self._proposal_targets['bbox_targets']

bbox_inside_weights = self._proposal_targets['bbox_inside_weights']

bbox_outside_weights = self._proposal_targets['bbox_outside_weights']

loss_box = self._smooth_l1_loss(bbox_pred, bbox_targets, bbox_inside_weights, bbox_outside_weights)

self._losses['cross_entropy'] = cross_entropy

self._losses['loss_box'] = loss_box

self._losses['rpn_cross_entropy'] = rpn_cross_entropy

self._losses['rpn_loss_box'] = rpn_loss_box

loss = cross_entropy + loss_box + rpn_cross_entropy + rpn_loss_box

regularization_loss = tf.add_n(tf.losses.get_regularization_losses(), 'regu')

self._losses['total_loss'] = loss + regularization_loss

self._event_summaries.update(self._losses)

return loss

損失函數中包含了RPN交叉熵、RPN Box的regression、RCNN的交叉熵、RCNN Box的regression以及參數正則化損失。

IOU的計算

def bbox_overlaps(

np.ndarray[DTYPE_t, ndim=2] boxes,

np.ndarray[DTYPE_t, ndim=2] query_boxes):

"""

Parameters

----------

boxes: (N, 4) ndarray of float

query_boxes: (K, 4) ndarray of float

Returns

-------

overlaps: (N, K) ndarray of overlap between boxes and query_boxes

"""

cdef unsigned int N = boxes.shape[0]

cdef unsigned int K = query_boxes.shape[0]

cdef np.ndarray[DTYPE_t, ndim=2] overlaps = np.zeros((N, K), dtype=DTYPE)

cdef DTYPE_t iw, ih, box_area

cdef DTYPE_t ua

cdef unsigned int k, n

for k in range(K):

box_area = (

(query_boxes[k, 2] - query_boxes[k, 0] + 1) *

(query_boxes[k, 3] - query_boxes[k, 1] + 1)

)

for n in range(N):

iw = (

min(boxes[n, 2], query_boxes[k, 2]) -

max(boxes[n, 0], query_boxes[k, 0]) + 1

)

if iw > 0:

ih = (

min(boxes[n, 3], query_boxes[k, 3]) -

max(boxes[n, 1], query_boxes[k, 1]) + 1

)

if ih > 0:

ua = float(

(boxes[n, 2] - boxes[n, 0] + 1) *

(boxes[n, 3] - boxes[n, 1] + 1) +

box_area - iw * ih

)

overlaps[n, k] = iw * ih / ua

return overlaps

IOU覆蓋率的計算過程：IOU=C/(A+B-C)

IOU計算

分享到:

閱讀更多 半杯茶的小酒杯 的文章

關鍵字: 損失機器學習函數

機器學習-Faster RCNN的損失函數(Loss Function)

Smooth L1 Loss

代碼實現

相關文章:

Golang 切片，函數，追加和複製

linux編程之pipe()函數

零基礎入門Python：基本命令、函數、數據結構

shell-函數

Python爬蟲總結：time()函數

Python,函數,數據類型-小白上樓梯0x06

淺談 Softmax 函數

關於 order By 函數，你可以知道更多

shell腳本編程學習之路-函數

從零開始學Python-Day13-函數

一句話徹底理解JS中的回調(Callback)函數

JavaScript 函數

javascript 函數

學習筆記Python篇~函數

Python學習入門(9)—函數

03.05 Python學習入門(9)—函數

自學Python-10 函數

03.01 棧的C語言模擬和C++函數

02.25 PHP array() 函數

golang-3- 函數

Scala 學習（2）之「函數」

02.01 零基礎學C語言——函數

C語言小白入門之「C語言 " 函數 "」

MySQL存儲過程實戰一：函數、視圖、存儲過程對比以及應用場景

怎樣才能寫好一個 Python 函數

Python3 函數

09.26 學Python，從列表推導到zip()函數，這五種技巧應知應會

百戰卓越班學員學習經驗分享:eval() 函數

Shell腳本100例：31 函數

03.01 Python3 自學第11天：def 函數

《python教程:從入門到實踐》——函數+類

如何用 Python 編寫你喜愛的 R 函數

Mysql視圖、觸發器、事務、儲存過程、函數

C語言教程（算法、數組、函數、指針）全方位講解PPT合集

常用 SQL 函數

Python學習小結——函數

RAND()函數和TIME()函數，從隨機數值到隨機時間的實現過程

06.13 Python 字符串格式化 Format 函數

06.09 Python字符串 Split 函數

05.27 第五章 函數

第五章 函數

04.27 "VBA“與”函數"的一次完美邂逅

"VBA「與」函數"的一次完美邂逅

MT4自動交易軟體編程（4）-函數

MT4自動交易軟件編程（4）- 函數

Python學習之路7-函數

03.28 python掃盲之三--函數

Excel函數只——比SUMIFS()還方便的DSUM()函數

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

05.27 第五章函數

第五章函數

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？