機器學習入門:3分鐘瞭解監督與無監督模型的性能評估標準

前面在 講過什麼是機器學習,能做哪些事情。從有無分類目標,可以大致分為監督學習和非監督學習,各個類別下又有很多具體的算法模型。那麼在眾多的機器模型中怎麼評判模型的優劣呢?因此本文重點介紹一下不同的機器學習模型場景採用何種評估標準。

監督學習之分類評估

分類評估主要介紹如下幾個指標:準確率、召回率、精確率、F1指標。

機器學習入門:3分鐘瞭解監督與無監督模型的性能評估標準

準確率(accuracy):是預測正確的樣本數量與總樣本數量的比值。

召回率(recall):又稱為“查全率”,是該類目標預測正確的樣本數量與該類目標的總數量的比值。

精確率(precision):又稱為“查準率”,是該類目標預測正確的樣本數量與各類目標的預測正確數量之和的比值。

F1指標(F1-measure):這是一個綜合考慮召回率和精確率的指標,公式為2除以召回率的倒數與精確率的倒數的總和。

機器學習入門:3分鐘瞭解監督與無監督模型的性能評估標準

二分類任務下,預測結果和正確標記之間存在4種不同的組合,構成混淆矩陣。

如下圖所示:

機器學習入門:3分鐘瞭解監督與無監督模型的性能評估標準

監督學習之迴歸評估

迴歸評估指標主要指標如下:平均絕對誤差(MAE)、均方誤差(MSE)、R-squared。

機器學習入門:3分鐘瞭解監督與無監督模型的性能評估標準

平均絕對誤差(MAE):又被稱為L1範數損失(L1-norm loss),是所有單個觀測值與算術平均值的偏差的絕對值的平均。平均絕對誤差可以避免誤差相互抵消的問題,因而可以準確反映實際預測誤差的大小。

機器學習入門:3分鐘瞭解監督與無監督模型的性能評估標準

均方誤差(MSE):又被稱為L2範數損失(L2-norm loss), 是所有單個觀測值與算術平均值的偏差的平方值的平均。

機器學習入門:3分鐘瞭解監督與無監督模型的性能評估標準

平均絕對誤差、均方誤差都會隨著不同的預測問題而變得差異很大,欠缺可比性,因此R-squared評估指標出現了,它既考慮迴歸值與真實值得差異,也兼顧了問題本身真實值得變動。

R-squared:用來衡量模型迴歸結果的波動與可被真實值驗證的百分比,可體現模型在迴歸方面的能力。

機器學習入門:3分鐘瞭解監督與無監督模型的性能評估標準

其中, SSres代表迴歸值與真實值之前的平方差異(迴歸差異),SStot 代表測試數據真實值的方差(內部差異)。

非監督學習之聚類評估

上面介紹監督學習的兩類模型的評估標準,主要是通過預測目標和真實目標的對比來進行評估。但是非監督沒有目標數據,該如何進行評估呢?下面主要介紹一下沒有目標數據的聚類評估指標:凝聚度、分離度、輪廓係數

機器學習入門:3分鐘瞭解監督與無監督模型的性能評估標準

凝聚度(cohesion):對於已聚類數據中的樣本,計算該樣本與同一類簇中的所有其他樣本距離的平均值。

分離度(separation):選取一個樣本,計算該樣本與該樣本外的一個類簇內的所有樣本的平均距離,遍歷所有其他類簇,找到最近的這個平均距離。

輪廓係數(Silhouette coefficient):適用於實際目標信息未知的情況。它同時兼顧了聚類的凝聚度 和 分離度。輪廓係數計算公式為:

s=(b−a)/max(a, b)

對於單個樣本,設a是與它同類簇中其他樣本的平均距離,b是與它距離最近不同類簇中樣本的平均距離。對於一個樣本集合,它的輪廓係數是所有樣本輪廓係數的平均值。同類別樣本越距離相近且不同類別樣本距離越遠,聚類效果最佳。

輪廓係數取值範圍是[−1,1],如果係數小於0,說明樣本的內部距離大於最近的類簇,表示聚類小區不好;如果係數係數接近於1,說明樣本的內部距離遠遠小於最近的類簇,表示效果較好。

好了,今天就到這吧!大家理解了嗎,如有疑問,歡迎關注留言。


分享到:


相關文章: