以 AI 對抗 AI:“守護者”楊勇和騰訊安平的進化

三年前,騰訊安全平臺掌舵人楊勇遇到一個名叫“快啊答題”的黑產團隊,後者專攻驗證碼破解,俗稱“打碼”。單在 2017 年一季度,“快啊答題”的打碼量高達 259 億次,識別率超過 80% ,一騎絕塵,幾乎壟斷了地下打碼市場。

打碼一般是採取“人工+OCR”方式,而驗證碼安全方也在不斷升級,特別是像 12306 這類應用,需要根據文字辨認圖片,識別率低,對黑產來說有不小的難度。

“快啊答題”用到了當時最流行的 Caffe 深度學習框架,使用了卷積神經網絡模型,只要輸入原始圖像,就可以通過深度學習獲得高識別率。他們收集了大量不同風格的驗證碼,作為訓練樣本,樣本庫超過 5000 萬。

AI 技術如此齊整整地用於黑產,這是國內首例。

不僅如此,這個 AI 打碼技術還被包裝成接口(API),對外提供服務,打通了從打碼、曬密,到撞庫的整個黑色產業鏈條。

黑產對新技術的“好奇心”、“開放性”和“動手能力”讓楊勇震驚。要知道,當時 AI 也才剛剛熱起來,楊勇仍在內部向團隊一次次解釋“安全為什麼要用 AI”,而現在,武裝了 AI 的黑產已經攻到眼前。

“我們以守護者自居,但‘江洋大盜’都用上火槍了,我們還在那兒討論到底是砍刀牛還是火槍牛。至少我們先配上火槍嘛!”楊勇說。

成為 Coolc

黑產是黑客產業鏈,準確地說應該叫駭客。與之相對,還有一撥白帽黑客(也被稱為白帽子),是用自己的黑客技術來維護網絡正義的安全愛好者。

早期的白帽黑客主要是喜歡鑽研系統、研究技術的一撥人,楊勇自己便是其中一員。他們是一群技術完美主義者,不斷尋找網絡系統中的漏洞,並迫使其不斷改進。

進入首都經貿大學的第一天起,作為文科生的楊勇就成了圖書館的常客,四年下來,每一本計算機書籍的借書卡上都留下了他的名字。

大三時他看了一本講黑客攻防的書,書裡列了 2000 多個黑客工具,還夾帶一張光盤。

其中的很多工具作者都活躍在當時最富盛名的安全焦點論壇,但這 2000 多個工具卻沒幾個好使的。楊勇嘗試按著可找到的郵箱地址聯繫作者,向其指出工具裡的 bug,有個人回覆了他,這人叫冰河,真名黃鑫,號稱“木馬教父”,是安全工具 X-Scan 的作者。

冰河在回郵裡說:“你提的 bug 沒法重現,要不我們見一面,看看問題在哪?”就這樣,通過冰河,楊勇走進了安全圈。

以 AI 对抗 AI:“守护者”杨勇和腾讯安平的进化

(圖注:在安全焦點論壇的楊勇給自己起了 Coolc 這個ID)

冰河所在的安全焦點論壇,聚集了眾多的第一代白帽黑客。每個白帽黑客都有一個 ID,楊勇也給自己起了一個 ID 叫 Coolc 。

大四要畢業時,楊勇先找到了冰河:你們這個挺酷,我能不能參與?

冰河的回覆是:可以參與,但如果不是專科出身,薪水會很低。楊勇覺得,加入這個圈子,就能和一群高手交往,算上學費,薪水也可以了。這個換算不能算牽強,當時他報一個 7 天的基礎課程班,都還需要和父母借上一筆錢。

於是,在經濟系的同學紛紛去銀行入職時,楊勇選擇了北京一家航天科技企業做網絡安全研究員。工資確實不高,但每個月 15-25% 的資金是絕對不能動的,這是他為自己購買計算機書的特定經費。

早期的白帽黑客其實很多都不是科班出身。冰河當時召集了一次第一代白帽黑客的大聚會,楊勇作為為數不多的 80 後,坐在一堆大哥面前,詢問各家的專業出身,有說是中文系的,還有說是鍋爐行業的,算下來,一半是非計算機專業。大家全憑愛好驅動,多數是像楊勇這樣,有熱情,有耐心,願意花時間鑽研。

進入公司後,為了節省從北京城南到城北近四個小時的通勤時間,楊勇帶著一張行軍床住到了單位,這其中還有一個私心是,單位裡有平時接觸不到的昂貴小型機,自己可以藉著下班時間在上面練手。

機房溫度低,開著窗戶覺得冷,關上窗戶屋裡味道又太大,楊勇半夜常常進行著開窗又關窗,關窗又開窗的循環動作。有一次不小心睡著了,鍋爐燒著,水蒸氣漫了整個樓層,航天部的同事半夜集體出動,端著消防器材著急忙慌趕來要滅火,才發現這位常駐同事。

從安焦到安平

2004 年,QQ 註冊用戶突破 3 億,屢屢被黑客攻擊問題困擾的騰訊對安全人才表現出前所未有的飢渴。為了組建安全部門,騰訊主要創始人之一、原 CTO 張志東四處找人。

在安全焦點論壇兩年後,楊勇被引薦給騰訊。他從北京來到深圳,此時騰訊剛剛組建了安全運維組,總共也就兩個人,楊勇幾乎經歷了騰訊整個安全體系從無到有的建設過程。

安全團隊從組建起就被給予了極高的重視度。張志東在骨幹面前不厭其煩地一遍遍強調安全之於騰訊的重要性,極力擴充人馬。他站臺的騰訊安全峰會,將全國的白帽黑客集聚於深圳。也是在這一時期,騰訊成為第一個建立 SRC(安全應急響應中心)的互聯網公司。年終總結大會上,馬化騰親自為安全團隊頒獎,團隊的同學在臺上熱情地高喊口號:“保護騰訊,保護 QQ!”

以 AI 对抗 AI:“守护者”杨勇和腾讯安平的进化

(圖注:2013 年,安全平臺部在騰訊內部主辦的第六屆安全技術峰會)

那時的安全,除了騰訊幾萬臺服務器的安全,防止木馬和滲透,主要就是 QQ 客戶端的安全:查殺 QQ 盜號木馬。

到 2009 年,楊勇的安全運維團隊已有 20 人,主要應對盜號的黑產,QQ 醫生是主要的武器。但結果發現,很多操作系統自身就不安全,到了 2010 年,QQ 醫生變成電腦管家,額外承擔了操作系統的安全工作。

楊勇的職責,除了要保護 QQ,還要保護騰訊旗下的幾十款應用軟件,團隊也被升級為騰訊安全平臺部,也就是現在騰訊內部所稱的“安平”。

以 AI 对抗 AI:“守护者”杨勇和腾讯安平的进化

(圖注:2009 年,安全平臺部年會)

何謂平臺?一是應用程序,二是操作系統。黑客想突破,就要找後門,突破它們的權限。應用程序安全有電腦端的,是桌面安全;手機端的,就是移動安全。

如今操作系統的概念也在不斷延伸,有個人電腦端的,有服務器上的,還有網絡設備的操作系統。廣義來講,雲服務對於用戶而言,也可以看作一個虛擬的操作系統,可以申請虛擬的 CPU、存儲,這也就有了雲的安全。

傳統安全領域的戰場基本覆蓋這些範圍,攻防也在這個戰場展開。

然而 AI 一來,戰場從傳統操作系統平臺擴展到 AI 基礎設施領域,攻擊工具和方法有 AI 加持 ,攻防雙方的力量失去平衡,也就有了“快啊答題”這種黑產在短時間內的橫掃。

AI 安全戰事興起

2016 年,楊勇去了趟硅谷,拜訪了谷歌、Facebook,也約見了蘋果等一眾頭部公司的同仁。坐在幾位硅谷工程師面前,聽對方滔滔不絕地分享著 AI 在安全上的應用,楊勇想通了。

當國內還困在 AI 利弊問題的辯駁中時,硅谷這群工程師已經能夠引出 AI 安全的實戰案例,他們沒有在現有的安全技術和 AI 技術之間糾結取捨,在前沿研究上更大膽,也更為果斷、開放地擁抱了新技術、新力量。

2017 年,安平內部成立了很多興趣小組,每個小組研究一類新技術方向,其中一個叫 Tencent Blade Team 的小組研究的是谷歌剛剛開源的 TensorFlow 深度學習框架,這個 AI 框架當時已有不少人使用,但很少有人研究它的安全問題——也或者是能力跟不上。

Tencent Blade Team 小組出手打破了 TensorFlow 0 漏洞的記錄,一連發現並報告了 TensorFlow 的前 7 個安全漏洞。比較典型的一個是,黑客可以構造惡意的虛擬文件,框架只要一讀取文件就會被攻破,前者便可由此控制整個系統。另外,框架使用的第三方庫,處理協議時也會有溢出,導致框架被控制。

以 AI 对抗 AI:“守护者”杨勇和腾讯安平的进化

(圖注:Tensorflow 發佈的安全公告及致謝)

這些問題報給谷歌時,谷歌甚至還沒有漏洞的報告渠道,是騰訊安平的 TSRC(騰訊安全應急響應中心)協助他們建立並完善了漏洞報告機制。

深度學習框架可以比作 AI 的基礎設施,這意味著黑客不僅僅是像“快啊答題”那樣,利用 AI 框架來破解,框架本身甚至也成為了攻防的前線。

對於互聯網用戶而言,更直觀的感受就是 DeepFake ,用 Deep learning (深度學習)來 Fake (偽造)圖像和視頻,可以讓已有的圖像或視頻疊加到目標圖像和視頻上,可用於名人影片、惡作劇、假新聞、色情行業等,以假亂真,混淆視聽,由此帶來的影響至今未息。由此,大眾也開始認識到了 AI 的另一面:AI 能帶來生產力的提高,也能帶來倫理、隱私和安全問題。

真正的 AI 安全問題還隱藏在冰川之下。除了框架這樣的 AI 基礎設施,數據、模型、算法,任何一個環節都是攻防的最前線。

一方面是 AI 基礎設施被攻擊,傳統的後門概念的邊界,從應用程序和操作系統權限,被延伸到數據、模型、算法。

另一方面是 AI 技術帶來的攻防失衡。如果攻方用了 AI ,守方不用 AI ,後者就會處於完全的被動,被攻擊得體無完膚。

在安全問題上,攻方在突破上本身佔據優勢,如驗證碼問題,只要有 20% 的識別率,攻破的概率就非常之高;而守方必須是 100% 的防守,出現一點點漏洞,造成的破壞效果便不可估量。

攻守雙方成本也有著相當的懸殊。比如盜號的挑戰,對於騰訊這樣強社交應用的公司,是個經典的安全問題。對方可能有 100 萬臺肉雞,用一個蠕蟲程序、一個程序員就可以發起攻擊;防禦方則需要有 100 萬臺機器防禦,全部是真金白銀的投入。

以 AI 对抗 AI:“守护者”杨勇和腾讯安平的进化

(圖注:2014 年,TSRC 在北京討論 SRC 發展)

最常見的 DDoS 攻擊,之前是靠人值守,相當於冷兵器對戰。安平曾有一位同事由此得一外號,叫“一夜七次郞”,一晚上最多要起床七次,抵禦攻擊。

如今騰訊安平的宙斯盾上線了用 AI 分析運維人員的行為模型,用 AI 探索 DDoS 攻擊檢測新思路。基於其操作習慣排查攻擊行為,可以實現秒級響應,被看作一種現代兵器式的防禦。守方把 AI 運用得當,才能掌握主動。

除了在 DDoS 攻防場景,騰訊也嘗試將 AI 技術運用到更多的安全場景中。如通過與流量分析結合,助力傳統基礎安全能力的提升。

騰訊安平門神 WAF(Web Application Firewall,WAF)基於騰訊海量正常流量和人工打標的惡意攻擊流量,建立了豐富高質量的黑白樣本庫,通過 AI 機器學習算法的應用,在樣本訓練測試中攻擊檢出率可以達到 99%,同時誤報率控制在 0.03% 以下。

眾生守護者

2018 年春節的團隊聚會,楊勇在飯桌上照舊和同事們描繪著 AI 安全的藍圖。酒酣之際,每個人都有些興奮,聊天也越來越開懷。同坐的女同事坦承自己曾對這份工作懷有的猶疑。她的專業是圖像識別,在當前科技行業機會遍地,而做安防需要同時研究硬件與 AI 算法,基本等於進入一個全新行業,曾在前期有過不小挫敗的楊勇對這種跨界的挑戰深有感受。

但也是在春節前的這段時間,看到被拐賣兒童因為AI 安全的助力被尋回,身為人母的同事更堅定了對這份工作的認同:自己所從事的事業正在保護很多人,正在為社會帶來可預見的改變。

“人內心的動力是很可貴的。”楊勇說。

騰訊安平團隊還基於視覺 AI 技術,研發了一套智能視頻分析解決方案,推出了 “智能跌倒監測系統”,通過人工智能技術對視頻數據進行檢測、分析,幫助深圳的養老護理院判斷老人是否摔倒或有走失風險,並在第一時間預警,以縮短救援時間。在楊勇看來,這更是“安全人”利他價值觀的體現。

安全從業者長期隱於幕後,“被需要的時候才會被想起”是這個群體的宿命,失敗要獨自承受壓力,成功也少有人覺察、記住。進入安全行業,既要時刻學習,擁抱變化,也要做好長時間和孤獨打交道的準備,但獎勵是身在其中的人也會獲得一種“眾生守護者”的價值感。

在安全行業近 20 年,楊勇越來越覺得,不管是 AI 還是其它技術,最重要的在於,可以輔助人做善良的事,這一點尤其重要。

做善良的事,然後一步步改變社會,安全人守住這個價值觀,也才能守護眾生。在此,安全人的使命也和騰訊力主的“科技向善”實現匯流。

Q & A

AI 源創評論:走上安全這條職業道路,對你影響最大的一件事是什麼?

楊勇:遇見貴人,比如像我遇到冰河。不需要多,但他會在人格上影響到你,讓你對自己長遠的發展有一個清晰的認知。這會決定你道路的選擇。

AI 源創評論:這些年你對於安全的理解,出現過哪些變化?

楊勇:我在航天領域的時候,對安全的理解就是 0 分和 100 分,比如衛星一出事就完了,要麼就是 100 分,就是成功了。

從航天行業出來以後,我發現不完全是這樣。安全本質上是一個投入產出比的問題,怎麼讓壞人放棄?一個很重要的策略就是讓他的成本過大,讓他覺得不值得這樣做。那時我就會做一個很難的技術,去防禦,讓對方過不來。

幹了十幾年以後,我發現這個認知又不對了,因為對手在進化。以前黑客是孤狼式的,現在孤狼越來越少,都是團隊作戰,而且各有分工,有一堆專有設備和大數據支撐。如果從企業級的角度去看,之前的對抗理論就崩潰了。

攻防失衡了。攻擊方成本很低,做一次攻擊就像做一次轟炸,如果把你轟炸了,他就把這個城市佔領了,沒有佔領,他也沒什麼損失。而守城的人就不行,平常就老得準備防禦著,成本高。

這時候我們就發現 AI 是可以很大地緩解這種資源的不對稱性的。計算機科學、數據科學,都是可以極大緩解這種資源不對稱性的。一個企業,一個組織,包括一個國家,不可能無限投入資源,但是 AI 可以解決這個問題。

所以如果你是一個互聯網企業的 CEO,在 AI 安全上可能要關注兩類問題:一類是 AI 算法、基礎設施的安全;一類是如何用 AI 技術去做安全。

AI 源創評論:在 AI 安全這件事情上,你看到的國內和國外的情況有什麼不同?

楊勇:很多時候,文化差異會導致技術認知的差異。比如從文化上來說,從數據出發去做決策,在國外特別受重視,像航空航天、醫學這些很核心的東西都要依託於數據科學。社會的接受度高,導致他們產業的接受度也高。只要能用數據論證,就比較容易讓人明白,你是有一個配套的機制去驗證某個技術到底靠不靠譜的。只要能用行業的數據來證明,就比較容易被接受。

而咱們國內的特點是,對於應用場景接受度高。我們看重的是在一個特定場景,能不能帶來一些體驗上的改善。很多企業比較看重生存問題,盈利問題。

以 AI 对抗 AI:“守护者”杨勇和腾讯安平的进化

AI 源創評論:黑產的技術越來越強,攻方在使用 AI,我們守方也在使用 AI。以 AI 對抗 AI,怎麼決勝負?

楊勇:AI 安全裡,算法就像在冰山之上,但還有冰山之下的東西決定這件事,那就是數據和算力。

數據決定了你的天花板有多高,數據越豐富,理論上天花板的高度就越往上走。但是有這麼多數據,算力不夠怎麼辦?實際的攻防中,所有計算出的模型和效果都是有時效性的,必須要有超出常人的算力才行。

你會發現,學術界有些算法試驗數據特別好,但工業界沒法用,為什麼?有相當一部分原因是算力沒法支撐。所以,如果想做 AI 安全或者 AI 的工程化,得有一大批人解決好算法的工程化問題。

AI 有點像當年錢老造導彈,是一個非常系統的工程。它包括特種工程,算力的解決,基礎設施的搭建、安全保障,使用的場景,算法,模型,配套設施怎麼使用等等,越來越細分。

AI 源創評論:安平現在各個部門都需要具備哪方面的能力?

楊勇:每個部門要求不一樣。負責基礎安全的部門,需要對安全技術非常熟悉和了解;負責風控安全的,需要對黑產瞭解;平臺部門則需要對數據敏感度高。實驗室就要對業界特別敏銳,對新的東西特別開放,願意去研究。

AI 源創評論:從過去兩年的發展來看,2020 年的安全行業會有哪些變化?

楊勇:這兩年非常明顯地進入了數據和雲的時代,所以主要矛盾還是會在數據和雲上。

國內可能會產生的比較大的變化就是安全合規性問題。國家在合規方面的要求在明顯增強,2020 年要求會更加嚴格。企業的建設壓力和安全帶來的經營壓力一定會很大。安全的工程人員和建設人才,在之後兩年會特別稀缺。以前一個企業僱傭兩個安全人員就可以搞定的問題,會因為 IPv6 等變量搞不定了,所以這也會帶來雲市場的很大繁榮。

黑產挺敏捷的,也在不斷引入 AI 算法和新技術。一個一般規模或中大規模的企業,在數據積累、算力準備、算法研究上都很難跟雲化的安全能力相媲美。而黑產的積累程度可能要遠遠超過一個大規模企業,因為它成本很低,只要達到局部成功就可以獲利。

從這個角度看,中小企業安全的雲化是不可避免的,各種內外部環境都會把它往這個方向推動。

AI 源創評論:對於準備進入或者已經進入安全領域的從業人員,您願意給出什麼樣的建議?

楊勇:這個說起來比較天馬行空。首先是要對自己有信心,這條路比較艱難,沒有信心註定堅持不住。要花很多時間、精力去學習。一定要對做長期的沉澱有充分的思想準備,包括家人能不能理解和支持。

大多數做安全的人沒有高官厚祿,一般不出事兒的時候,大家想不起你。如果真的想做安全,就得忍受孤獨。你很難出現在鎂光燈下,一定要想明白這個事情。但是做安全會給你另外一種東西,就是“眾生守護者”的那種價值感。

(感謝黃善清對本文的貢獻。)

雷鋒網 雷鋒網 雷鋒網


分享到:


相關文章: