如何應用人工智能大數據,打擊網絡欺詐和金融犯罪?

這是一篇由DataVisor美國技術產品經理Catherine Lu發表在VentureBeat上的文章,由DataVisor中國區市場經理Lily Wang整理發佈。

如何應用人工智能大數據,打擊網絡欺詐和金融犯罪?

人工智能將成為未來的主流。它會在聯網的家裡、車裡以及其他任何地方出現。雖然它並不像外星人一樣吸引眼球,但是人工智能在監測欺詐行為上起到了重要的作用。與欺詐者較量是一場持久戰,這場戰爭中的雙方-好人陣營和壞人陣營,都在不斷快速變化技術手段,以讓人工智能發揮它的最大作用。

人工智能當前有三種主要對抗欺詐行為的方法,分別對應人工智能的不同發展領域。它們是:

1. 規則引擎和信譽列表

2. 有監督機器學習

3. 無監督機器學習

>>>> 規則引擎和信譽列表

在今天,很多現代的組織利用規則引擎和信譽列表打擊欺詐行為,這個類似於“專家系統”,它在1970年代首次進入人工智能領域。專家系統是結合了領域專家制定的規則的計算機程序。這些程序易於啟動和運行,並且有人的理解能力,但它們同樣也受到了限制:靈活性低、人力成本高。

“規則”是指人編碼的一個邏輯語句,它用來檢測存在欺詐的賬戶和行為。舉個例子,一個公司可能會制定一個規則:“如果一個賬戶花費了超過一千美元買一個東西,座標在尼日利亞,且登錄時間小於24小時,那就阻攔這筆交易。”

相似地,信譽列表是建立在已知的壞行為的基礎上。信譽列表就是一個涵蓋了一些IP地址、設備類型以及其他個別特徵及其對應的信譽評分的列表。然後,如果一個賬戶的IP地址出現在黑名單列表上,系統就會自動去攔截。

雖然規則引擎和信譽列表是檢測並預防欺詐的一個好方法,但是它很容易被線上欺詐者玩弄於股掌間。如今,在線網絡服務比比皆是,帳戶註冊的過程變得越來越容易。因此,欺詐者可以在短時間內創建幾十個甚至數千個賬戶,然後利用這些賬戶去學習規則引擎和信譽列表。欺詐者可以方便地訪問雲託管服務、虛擬私有網絡、匿名電子郵件服務、設備仿真器以及移動設備閃存,從而逃過信譽列表的檢測。

自1990年代以來,專家系統在很多領域都失去了效果,它輸給了更先進的技術。顯然,我們應該有更好的反欺詐的工具。然而,現代公司中的很多反欺詐團隊仍在用這種傳統的方法去檢測欺詐,這導致了大量的人工評估成本支出、誤報情況發生以及不準確的檢測結果。

>>>> 有監督機器學習

機器學習是人工智能的一個分支,它嘗試著去解決傳統檢測系統靈活性缺失的問題。研究人員想讓機器從數據中主動獲取信息,而不需要人工參與手動編程(與專家系統不同)。機器學習在1990年代開始取得卓越的進步,到了2000年代它被有效地用於反欺詐。

有監督機器學習可應用於反欺詐領域是一個很大的進步。它與規則引擎和信譽列表有很大的區別,因為它不再只是通過簡單的規則看幾個特徵,而是參考所有的數據特徵。

但這種方法的缺點在於:一個用於檢測欺詐行為的有監督機器學習的模型必須使用歷史數據來判斷欺詐賬戶和行為,並識別好的賬戶和行為。隨後,模型可以瀏覽與賬戶相關的所有的特徵來做出決定。因此,模型只能找出和原先的攻擊相似的欺詐行為。許多狡猾的現代欺詐者仍然可以避開這些有監督機器學習的模型。

現如今,應用於偵查欺詐的有監督機器學習是一個正在發展的活躍領域,有很多的有監督機器學習的模型和方法。例如,將神經網絡應用於反欺詐是非常有幫助的,因為它可以自動化特徵過程,而這個步驟是非常昂貴並且需要人為參與。這個方法相對其他有監督機器學習模型,可以減少誤報和漏報的發生頻率,例如支持安全虛擬機和隨機森林模型,因為其隱藏的神經元可以比人類編出更多的特徵可能性。

>>>> 無監督機器學習

相比有監督機器學習,無監督機器學習目前僅在較少的領域中有應用。在反欺詐檢測領域,無監督機器學習在過去並沒有發揮足夠的作用。常見的無監督機器學習(例如k平均方法和分級群聚、無監督神經網絡以及主成分分析)還沒有在監測欺詐中取得好的結果。

針對欺詐的無監督方法很難在內部構建,因為它需要同時處理數十億個事件,且目前沒有能即插即用的有效無監督模型。然而,有些公司在這一領域已取得了大幅進步。

無監督機器學習之所以可以用於反欺詐檢測,原因在於它可以剖析欺詐攻擊行為。

正常的用戶行為是沒有規律的,但是欺詐者有固定的攻擊行為模式(不管他們是否已經意識到了這點)。他們以一定的組織規模快速工作:一個欺詐者不會試著去從一個在線服務中一下騙取十萬美元,他們寧願從成千上萬的賬戶中分別騙取幾分到幾美元。這些行為活動總會不可避免地有規律可循,無監督機器學習可以監測到這些有組織、有規模的攻擊行為。

無監督機器學習的獨特優勢

1. 無需訓練數據,在損失發生前提前捕捉新的攻擊類型

2. 掌控所有的賬戶,阻斷欺詐者騙錢的途徑

3. 極大降低了誤報的發生概率

一套完整的欺詐檢測系統

每個方法都有優點和缺點,而我們可以從各個方法中受益。規則引擎和信譽列表的方法在不需要人工智能的情況下,可以在低成本的快速執行欺詐檢測工作,但是劣勢在於需要不斷更新,並且只能阻攔最基本、常見欺詐的攻擊行為。

有監督機器學習已經成為了一個即插即用的技術,它能夠考慮所有的單個賬戶的所有屬性或事件,但它並不能發現新的攻擊模式。無監督機器學習是新一代技術,它可以發現新的攻擊模式、識別和一次攻擊有關的所有賬戶以及提供一個完整的全局視圖;而另一方面,它在阻攔個人欺詐者的低等級攻擊上並不是很高效,並且很難在內部執行。不過,對於那些希望阻攔大規模或不斷受到攻擊的公司來說,無監督機器學習方法依舊是首選。

一個完整的欺詐檢測系統通常會同時採用這三種人工智能方法來應對欺詐。如果合理地同時使用這些方法,我們可以對每一個方法都揚長避短。

人工智能在反欺詐領域將會繼續進步,最終會遠遠超出上述的已有的技術水平。我們很難去把握下一個前沿,不過有一件事是確定的,那就是犯罪分子也會道高一尺、魔高一丈。這場使用人工智能、存在於欺詐和反欺詐者之間的鬥爭還會繼續進行下去。

備註:

DataVisor是硅谷大數據明星企業,其基於Spark大數據平臺獨創的無監督欺詐檢測算法每小時可分析數十億用戶事件,對新型的、變化多端的欺詐行為進行提前預警,並提早自動發現未知的惡意欺詐行為,為網絡欺詐和金融犯罪提供檢測服務。DataVisor一站式用戶分析平臺為個體欺詐和分佈式的群體欺詐提供最先進的反欺詐技術解決方案,例如解決盜號、虛假賬戶註冊、洗錢、虛假內容發佈、欺詐交易等問題。

DataVisor全球累計處理超過5千億的用戶事件,檢測超過5千萬的壞用戶,保護超過10億來自全球大型互聯網公司的用戶,客戶包括阿里巴巴、獵豹移動、陌陌、豆瓣等。更多信息,請訪問我們的官網 www.datavisor.cn


分享到:


相關文章: