網絡智能化背後,有什麼祕密?

4月20日,一年一度的NAVIGATE領航者峰會在雲上開啟,本屆峰會以“智·變”為主題。6天33個專題120+場演講,紫光集團及旗下新華三集團攜客戶、合作伙伴完整呈現了一個正在“智·變”的世界。各種智能化技術的應用,讓我們看到了智慧的更多可能性。英特爾將助力新華三在科技創新的路上,持續為百行百業提供優質的解決方案,共論“智·變”之道,共啟“智·變”之旅。

本文來講講新華三網絡的“智·變”。

網絡亟需智能化

數據中心網絡近些年最大的變革莫過於軟件定義網絡(Software Defined Network,SDN)的誕生,其通過使控制面與數據面分離,讓網絡具備了更高的敏捷性、可擴展性和可編程能力,在大幅提升網絡自動化水平的同時,有效降低了用戶在網絡部署和運維方面的壓力。

正因為此,短短几年,SDN就獲得了廣泛的應用,成為企業級用戶部署和配置網絡服務的重要選擇。

不過,好景不長。隨著用戶業務與網絡服務綁定的更為緊密,企業級網絡應用規模的不斷擴展,特別是在大規模雲數據中心這種複雜度高、調整頻繁的應用場景中,即便擁有自動化輔助手段,用戶的運維和成本壓力依舊很難真正緩解。

以企業園區為例,網絡服務不僅要滿足日常辦公應用,還需為生產製造、移動辦公、視頻會議等不同應用、不同質量要求的場景提供支撐,這意味著網絡要像服務器、存儲一樣隨時滿足業務需求的突然變化,峰值要增加資源,谷底要減少。顯然,僅自動化是不夠的,網絡需要更智能化。

網絡智能化背後,有什麼秘密?

為了滿足用戶的實際需求,新華三於2019年推出了更具智能化屬性的先知網絡架構(Seer Network Architecture,以下簡稱SNA),並以此為基礎開發數據中心網絡產品解決方案。短短一年間,該技術已在眾多用戶部署應用,反響熱烈。以山東大學為例,通過部署SNA方案,問題定位從小時級提至分鐘級,網絡維護工作量減少了80%。

今年,新華三對SNA再次進行了升級,嵌入了智能分析器和智能控制技術,也就是說網絡智能化程度再獲提升。

SNA的原理是什麼?

簡單來說,SNA的核心在於能夠通過“感知-分析-決策”模式,將豐富的網絡運維數據通過人工智能(Artificial Intelligence, AI)的訓練和推理過程,轉化為更優的網絡策略,進而幫助最終用戶有效提升網絡智能分析和業務編排能力,降低成本。

具體來說,SNA架構如圖一所示,其由先知服務中心、先知分析器(SeerAnalyzer)以及網絡控制器(SeerEngine)三大模塊組成。

其中,先知服務中心作為網絡智能管理、控制和編排的核心,不僅可根據用戶的業務需求實現智能編排、業務協同和資源調度,更能彙總各個網絡設備的數據,在其內部AI平臺中進行建模、評估、訓練和調優,並形成一系列智能網絡模型供調用。

網絡智能化背後,有什麼秘密?

圖一、SNA整體架構

如果把先知服務中心比作SNA的“大腦”,那麼先知分析器和網絡控制器就是SNA的“手和眼”。通過Telemetry等毫秒級採集技術,先知分析器可從網絡基礎架構中感知和採集各類數據,並經清洗、抽取、轉換等處理過程,上傳到先知服務中心中。

經過先知服務中心訓練和調優的模型,在雲端或先知分析器中進行AI推理後,可形成有效的自動化網絡部署和調優策略。而網絡控制器則會根據這些策略,以可編程的方式對網絡基礎架構實施管理,包括實現業務的自動化部署,網絡資源的最優路徑調度,以及網絡故障的預測告警和快速排除等。

大腦、手、眼協同配合,讓網絡變得更智能。目前,SNA已經能為用戶提供20餘種智能網絡算法以及100多種網絡狀態洞察方法。

智慧背後的強力支撐

講到這裡,必須提到為SNA提供強大算力支持及多種訓練模型優化方案的英特爾。眾所周知,由交換機、路由器、無線AP等各類基礎設備構成的網絡中,各種事務日誌、易損件狀態、異常告警等信息是巨量的,如果不能有效的處理,這些數據基本等同於沒用,而處理這些數據需要強大的算力。

正如新華三AI研究院院長敖襄橋所說,“SNA通過AI技術實時感知網絡狀態,基於網絡數據分析實現自動化部署和風險預測,從而讓網絡能更智能、更高效地為最終用戶業務提供支撐。通過引入第二代英特爾至強可擴展處理器以及面向英特爾架構優化的TensorFlow,SNA的AI訓練能力獲得了大幅提升,讓企業網絡在應對複雜業務場景時更加遊刃有餘。”

究竟提升有多麼明顯?新華三聯合英特爾進行了一系列面向實際應用場景的測試。下面就以DNS隧道檢測模型為例,展示一下提升後的效果。

作為網絡應用中重要的基礎協議之一,惡意程序經常會利用域名系統(Domain NameSystem,DNS)請求時形成的DNS隧道來對網絡實施攻擊,例如將數據封裝在DNS請求數據包中,從而繞開內外網隔離等防禦措施,造成企業內網的關鍵信息被透傳。

由於這類惡意攻擊隱藏到了DNS隧道中,因此,如圖二所示,常規的網絡安全檢測方法,例如特徵碼檢測、流量監測、威脅標誌(Indicators Of Compromise,IOC)檢測等都難以對其發揮作用。針對此,新華三以海量DNS請求報文為基礎,在SNA Service Center中構建基於長短期記憶網絡(Long Short-Term Memory,LSTM)的DNS隧道檢測模型,來幫助用戶提升網絡安全等級。

網絡智能化背後,有什麼秘密?

圖二、 基於LSTM的DNS隧道檢測模型

作為遞歸神經網絡(Recurrent Neural Networks,RNN)的重要衍生模型,LSTM可以通過3個特別的“門”結構設計,來大幅提升模型的記憶時長,因此特別適用於DNS請求這類典型的時序性數據。其可以圍繞一段時間內的黑白名單數據集中正常和惡意請求的不同特徵,例如主機名、DNS名稱、特定字符等,來預測新的請求中可能面臨的安全風險。

顯而易見,更長的時序特徵提取、更復雜的門結構,意味著模型在訓練和推理中需要更多的計算量。為此,新華三引入第二代英特爾至強可擴展處理器和麵向英特爾架構優化的TensorFlow。

網絡智能化背後,有什麼秘密?

圖三、DNS隧道檢測模型訓練性能歸一化對比

對比測試中,兩組測試的硬件配置相同,但基準組搭配的是原生TensorFlow,對比組搭配的則是面向英特爾架構優化的TensorFlow。驗證測試的黑白名單數據集包含了20000條黑名單樣本和30000條白名單樣本,並以10000條數據作為測試集。測試結果如圖三所示,同一硬件平臺,經過優化後,訓練性能可提升到基準值的3.2倍。

不止於網絡,一切智能化

其實,不僅僅是網絡,伴隨智能化浪潮來襲,更多企業級ICT設備都在朝智能化方向發展,特別是部署在大型雲數據中心內,在運維和管理上同樣需要AI助力的設備。

以服務器為例,早在多年前其運維就開始導入可感知其運行狀態(包括使用率、耗電量、散熱情況以及故障反饋)的遙測技術,以及與之相匹配的“監控-學習-行動-決定“管理機制,而隨著AI的一系列應用優勢,包括可利用數據訓練更好用和實用的管理和策略模型,並在無需或較少人工介入的情況下及時且併發響應不同事件,有的放矢地實施策略等能力在這些設備管理和運維過程中越來越凸顯其重要性,將AI方法引入這些ICT設備的管理和運維也成為大勢所趨。

實際上,繼SNA後,新華三已經開始攜手英特爾開展服務器管理方面的智能化探索。

在實際的比對測試中,相同硬件配置下,利用第二代英特爾至強可擴展處理器與面向英特爾架構優化的TensorFlow組合,模型的推理性能可提升至基準值的2.71倍;而在進一步導入並行多實例優化後,模型的推理性能還能在不影響延時的情況下,進一步提升到基準值的10.98倍。

網絡智能化背後,有什麼秘密?

圖四、服務器利用率模型的推理性能歸一化對比測試結果

總結全文,測試數據已經說明了一切,第二代英特爾至強可擴展處理器與面向英特爾架構優化TensorFlow的組合帶來的提升非常明顯。因此,我們有理由相信未來更多ICT設備會採用這樣的技術來提升智能化水平,而新華三和英特爾雙方也必然會在更多方面展開合作。智·變,在加速。


分享到:


相關文章: