AI在網絡安全領域的應用:機器學習 VS. 深度學習

AI在网络安全领域的应用:机器学习 VS. 深度学习

人工智能(Artificial Intelligence)最初可以追溯至1956年,當時幾名計算機科學家相聚在達特茅斯會議,提出了“人工智能”的概念,夢想著用當時剛剛出現的計算機來構造複雜的、擁有與人類智慧同樣本質特性的機器。其後,人工智能就一直縈繞於人們的腦海之中,並在科研實驗室中慢慢孵化。

如今,人工智能實現了爆炸式發展,幾乎所有行業(尤其是安全行業)中的所有軟件都至少採用了某種形式的AI技術。ESG研究發現,12%的企業組織已經廣泛部署了基於人工智能的安全分析,27%的受訪企業也已經在有限的基礎上部署了基於人工智能的安全分析。專家預計,這種部署趨勢會在2018年實現新一輪增長。

在過去幾年間,AI的主要子集——機器學習(Machine Learning)和深度學習(Deep Learning)——已經取得了突破性進展,幾乎為它們觸及到的每個領域帶來了翻天覆地地變化。如今,人工智能、機器學習以及深度學習等術語,已經成為人們耳熟能詳的高頻詞,但是仍然存在不少人對這三者的含義及其背後的關係似懂非懂、一知半解。

為了幫助大家充分了解每個術語的含義及其區別,接下來我們將為大家介紹每個子集的優點及其侷限性。

AI在网络安全领域的应用:机器学习 VS. 深度学习

機器學習的挑戰

“機器學習”的概念來自於人工智能發展的早期。在過去的25年裡,機器學習已經發展成為AI內部的領先分支。該技術主要通過使用算法來解析數據、學習數據,然後對真實世界中的事件做出決策和預測。因此,與傳統的為解決特定任務、硬編碼的軟件程序不同,機器學習是用大量的數據來“自我訓練”,通過各種算法從數據中學習如何完成任務。

舉例來說,當我們瀏覽網上商城時,經常會出現商品推薦的信息。這就是商城根據你往期的購物記錄和冗長的收藏清單,識別出這其中哪些是你真正感興趣,並且願意購買的產品。這樣的決策模型,可以幫助商城為客戶提供建議並鼓勵產品消費。

曾經,符號與邏輯被認為是人工智能實現的關鍵,而進入21世紀後,則是基於統計的機器學習佔據了主導地位。目前可以說,學習AI主要的是學習機器學習。但是,需要再次強調的是,人工智能並不等同於機器學習,機器學習只是人工智能的一個子集。

儘管這項技術很強大,但仍然存在缺陷,特別是當其應用於安全領域時,這種缺陷顯得尤為突出。

傳統機器學習的主要缺陷之一,是其依賴於特徵提取(feature extraction)——即人類專家規定每個問題的重要特徵(比如屬性)的過程。比如說,將機器學習運用於臉部識別時,圖像中的原始像素無法饋入到機器學習模塊裡面,需要先將它們轉換成特徵,例如瞳孔間距、臉部比例、臉部紋理和膚色等才行。

這就意味著,為了讓機器學習解決方案能夠識別惡意軟件,人類專家需要首先手動編制與惡意軟件相關的各種特徵。對於網絡安全領域而言,這無疑將會限制到威脅檢測的效率和精確度。因為人類專家需要定義特定的特徵,所以尚未定義到的特徵可能就會逃避掉安全檢測,使其無法被發現。

此外,這種對人類參與的依賴還引發了機器學習最大的挑戰之一——人為錯誤的可能性。鑑於“特徵工程”(將領域知識應用於特徵提取的過程)需要人類專家來定義特徵,就不可避免地會出現遺漏或忽略等人為失誤現象。在上述提及的惡意軟件例子中,如果人類專家在編程期間遺漏或忽略某些特徵,都可能會造成系統崩潰的結果。

可以這麼說,

大多數機器學習算法的性能取決於識別和提取特徵的準確性。為了使機器學習系統準確無誤,人類專家必須在方法論的基礎上定義特徵,因為機器學習是一種基於線性的模型(linear model),所以人類專家選擇的特徵只能依賴簡單的線性屬性。鑑於這種限制,一些企業及學者開始轉向研究深度神經網絡(DNN),以更好地保護其基礎設施,併為即將發生的攻擊做好準備。

所謂“線性模型”(linear model),即使用簡單的公式通過一組數據點來查找“最優擬合”線。通過你已知的變量方程(比如,原料),你可以求出你想要預測的變量(例如,烘烤蛋糕需要多長時間)。為了求出預測量,我們輸入已知的變量得到答案。也就是說,為了求出烘烤蛋糕需要多長時間,我們只需要輸入原料即可。

深度學習的發展

深度學習,也稱為“深度神經網絡”(DNN),它是機器學習的子領域,從人類大腦的工作機理獲得了靈感。深度學習與傳統機器學習在概念上的一大區別在於,深度學習可以直接對原數據進行訓練,而不需要對其特徵進行抽取。

例如,將機器學習運用於臉部識別時,圖像中的原始像素無法饋入到機器學習模塊裡面,需要先將它們轉換成特徵——如瞳孔間距、臉部比例、臉部紋理和膚色等方可。而深度學習則不需要任何特徵提取過程,能夠直接對原始數據進行“自我訓練”。此外,深度學習還可以擴展到數以億計的訓練樣本,並隨著訓練數據集不斷增長而得到發展和完善。

在過去幾年間,深度學習在計算機視覺、語音識別以及文本理解的大多數基準方面,已經實現了20-30%的提高——這是人工智能和計算機科學史上最大的性能飛躍。能夠實現如此突破的部分原因在於,深度學習能夠檢測數據之間的非線性相關性,而這些數據對於人類來說通常太過複雜,以至於根本無從定義。與傳統的機器學習不同,深度學習支持任何以及新的文件類型,並且能夠檢測出未知攻擊,這對於網絡安全領域而言是極具吸引力的優點。

雖然,這些優勢使得深度學習在某些方面超越了基於機器學習的解決方案,但其同樣面臨著一些挑戰。研究人員需要負責包含數百萬個文件的大量數據樣本來訓練神經網絡,並處理高度複雜的算法。

深度學習對於安全性的影響

如今,深度學習已經在各行各業中得到了實施,特別是在網絡安全方面產生了重大影響。2017年最大的惡意軟件攻擊——如WannaCry、NotPetya以及DDoS事件等——促使企業重新思考其安全策略,及其對於未來攻擊的被動應對方式。對於整個網絡安全行業而言,能夠以最少的人際交互實現最有效的應急響應,是其一直追求的目標。因此,由於深度學習能夠減少人際交互的事實,所以組織正紛紛轉向基於深度學習的解決方案。

深度學習能夠在不需要任何人員參與的情況下,實時防範新出現的惡意軟件,同時保持低誤報警率,這對於保護端點、移動設備、數據以及基礎架構都非常有利。在成功防止惡意軟件之後,深度學習技術還可以幫助公司瞭解它是什麼類型的惡意軟件——即勒索軟件、後門程序或間諜軟件——以採取進一步的安全措施。在大多數情況下,這需要專家對信息進行適當的分析,然而深度學習軟件會自動識別和分析數據,而無需人為干預。

同樣地,該技術還可以用來確定特定攻擊源自何處。過去,由於各種原因限制,實現這一目標對於企業IT和安全團隊而言一直是一項艱鉅的任務。例如,每個民族國家通常有不止一個用於開發這種先進惡意軟件的網絡單位(cyber unit),這就使得傳統的署名權歸屬算法(authorship attribution algorithms)毫無用武之地。此外,APT通常會使用最先進的逃避技術,不過,DNN有能力學習APT本身的高級特徵提取。

2018年,深度學習在安全領域的持續成功將令人興奮,而且它不會止步於此。除了安全領域之外,深度學習還正在為氣候製圖、抗擊衰老和疾病等許多其他行業帶來革命性的變化,不可否認,該技術帶來的影響是深遠的。


分享到:


相關文章: