機器學習加持下的時序類數據異常智能監控 這個是難點主要如何監控異常日誌
主要算法描述:
在機器學習中,隨機森林是一個包含多個決策樹的分類器,並且其輸出的類別是由個別樹輸出的類別的眾數而定。
Grubbs算法檢測離群值
一組測量數據中,如果個別數據偏離平均值很遠,那麼這個(這些)數據稱作“可疑值”。如果用統計方法—例如格拉布斯(Grubbs)法判斷,能將“可疑值”從此組測量數據中剔除而不參與平均值的計算,那麼該“可疑值”就稱作“異常值(粗大誤差)”。本文就是介紹如何用格拉布斯法判斷“可疑值”是否為“異常值”。
閱讀更多 JiaGouS 的文章