吳恩達公開課心得——異常檢測算法_科技 _ 頭條網

異常檢測的問題

異常檢測問題一般是這樣的。

也就是說通過給定的無標籤數據的統計特徵，建立概率模型。然後用該概率模型來預測那些數據是異常的，即這些數據的出現概率很低。

比如網站需要檢測異常用戶，它就需要記錄用戶的登陸頻率，訪問某個頁面的次數，論壇發帖的次數，用戶的打字速度等等，然後用這幾個維度建立一個統一的概率模型，然後就可以判斷新的用戶是否存在異常。

異常檢測算法

對於每個特徵都構建一個正態分佈的概率函數，然後總的概率就取這些概率的乘積。即便存在非獨立的情況，這個算法也大體上能正常工作。

評估異常檢測算法

要評估這個算法，就需要有帶標籤的數據用作交叉驗證集和測試集。這一點和有監督的學習算法又有點像。

假設又10000個正常的樣本和20個異常的樣本。

那麼，可以設置6000個正常的樣本用作訓練集，然後取2000個正常樣本和10個異常樣本用作交叉驗證集，剩下的2000個正常樣本和另10個異常樣本用作測試集。

可用的評價指標包括

測準率和召回率或者F1-score等。

何時使用異常檢測算法

當你的樣本中有大量的正常樣本和極少數的異常樣本時，使用異常檢測算法的效果比使用有監督學習算法更有效。

假如將來出現的異常樣本的原因可能與當前的異常原因不同，那麼對於這種新異常，用異常檢測算法效果更好。

如何選擇特徵

假如某個特徵的直方圖呈高斯分佈，那麼這個特徵比較適合用於異常檢測。假如某些特徵分佈的兩邊不對稱，可以採用log(x+C)處理。或者指數處理。

假如使用異常檢測算法，某個異常樣本獲得了一個較高的概率，那麼就需要檢視特徵是否足夠合理，或者是否需要增加新的特徵，用來區分出這個異常樣本。例如兩個特徵的商或者乘積等等。

多維高斯分佈

有時候兩個特徵之間具有一定的相關性，用之前的建模方法可能需要多次嘗試不同的新特徵，才能建立合理的模型。如果採用多維高斯分佈模型，可以直接把相關性考慮到模型中去。建立的模型更加精確。以下是兩維高斯分佈的協方差矩陣對最終概率分佈的影響。非常直觀，建議收藏。

應用場景

那麼是否可以用多維高斯分佈取代之前的異常檢測算法（不考慮相關性）呢？顯然不行。

當特徵較少（m>10n）時，可以考慮多維高斯分佈。當特徵非常多時，可以考慮不考慮相關性的異常檢測算法，通過構建新的特徵來處理相關性。因為特徵多的時候，協方差矩陣求逆將是一個非常好運算量的事情，另外協方差矩陣還存在不可求逆的可能。

異常檢測的問題

異常檢測算法

評估異常檢測算法

如何選擇特徵

多維高斯分佈

應用場景

相關文章:

小米太無恥了。

蹭熱點！說說我理解的手機包裝盒事件。

蘋果公司正式發佈iPhone SE二代手機

華為河圖、麒麟芯片和鴻蒙OS三駕馬車並行？華為生態建設佈局深遠

小米高管表示，四千毫安時 5G 手機，和三千多毫安時 4G 手機一樣

5G畫風變了：麒麟985落地首跑，榮耀坐上開往高端的「地鐵」

旗艦手機標配Wifi 6 換Wifi 6路由器的時機到了嗎？

2020年5G手機賣不動？繼蘋果砍單25%之後，華為小米紛紛跟砍？

幹翻華為P40系列 榮耀30也玩中

程序員辭互聯網工作，跨行傳統上市公司，上班第1天就蒙了

蘋果發佈新款iPhoneSE，3299元起售

我很糾結：我究竟適不適合做亞馬遜電商？看了這三條你就知道了

請仔細閱讀，關於跨境電商你想知道的都在這兒

騙子手段太“精明”：商家賠了貨物又賠款，亞馬遜平臺騙術大揭祕

做跨境電商這麼多年，今天才知道給國外客戶發文件原來這麼簡單

值得收藏！三類賣家三種選品方案，總有適合你的一個……

萬萬沒想到！亞馬遜平臺上面賣床單竟營收一個億！你還在等什麼？

做店鋪這麼多年，今天才知道我的listing突然被封，竟是因為……

亞馬遜小白看過來！請採納這些：亞馬遜選品和運營的小建議

亞馬遜賣家如何爆單？跨境精細化運營攻略必看

不收保證金、入住費、年費，還免三個月佣金，我也想入駐這個平臺

馬雲終於要辭職了，留下的話句句觸動人心

等等，明年5G手機將迎來大降價

微信公開課PRO版2019正在進行時，往屆各自都有什麼黑科技

推出「信任分」升級「閃購」，美團本地生活這盤棋有多大？

5G我們超越了6G我們也將領先! 美國為什麼會害怕失去5G領導地位呢

界讀｜華為：幫助英國共渡疫情難關，無端批評令英國蒙受損失

為什麼華為今天可以傲視群雄，在世界上立於不敗之地？

血戰「在線辦公」，阿里、騰訊、字節、華為的底牌與大殺器

2020年最強拍照旗艦來了 華為P40系列多項業界首創 香！

今天聊一聊直播

通過直播賺錢不容易，既要豁得出去，又要端得起來

AI和自動化技術聯手，最終會讓60%的工人失去現有的飯碗。

這個網還能不能好好上了？今日全球IPv4地址正式耗盡

12306系統不行？內行人告訴你它有多牛，阿里騰訊高手去了也膜拜

有內幕？美國防部授與微軟百億雲合同，亞馬遜不滿發起訴訟

未來之芯--RISC-V總部從美國遷往瑞士，華為、阿里是其成員

神話還能繼續嗎？幾度過山車，比特幣半年來首次跌破7000美元

劉強東卸任後，突然宣佈一個“好消息”，讓馬雲措手不及！

蘋果的瘋狂其實從未停止，AirPower或將重新啟航

幹翻華為P40系列榮耀30也玩中

2020年最強拍照旗艦來了華為P40系列多項業界首創香！