09.06 楊望:大數據重塑風控新格局

編者按:風險控制的思想最早起源於1931年的美國。在1929-1933年的世界性經濟危機的大背景下,美國40%的銀行和大型企業相繼破產倒閉。為了應對經濟風險,美國管理協會(AMA)在全美推行風險控制的理念,提倡大型企業和商業銀行在內部設立保險部門,以保險項目來控制風險。

瀚德金融科技研究院副院長、中國人民大學國際貨幣研究所研究員楊望,瀚德金融科技研究院研究員曲雙石在《長江大數據》撰文探討風險控制理念金融領域的廣泛應用。

楊望:大數據重塑風控新格局


傳統金融風控模式的尚存問題

在幾百年的金融進化史中,政治層面、信用層面、操作層面、系統層面、經營層面、市場層面等各類風險遍佈於整個金融環節。為了轉移或消除部分風險,傳統金融風控模式應運而生。

我國的金融體系是信貸主導型,信貸市場規模全球第一。《巴塞爾協議III》的出臺,對商業銀行等傳統金融機構的影響是巨大的。商業銀行的業務定位有了全新的變化,不再是簡單的金融服務和信用中介,風險控制在商業銀行中扮演著更為重要的角色。為了更加直接地防範系統性風險的出現,提高政府在經濟活動中的控制力,互聯網金融誕生以前,以商業銀行為代表的傳統風控模式成為了最符合國情的風控模式。與國外發達國家相比,我國商業銀行的風險控制水平遠遠落後,許多問題亟待解決。《巴塞爾新資本協議》頒佈實施後,商業銀行等傳統金融機構不再只關注信用風險和市場風險的風險控制,而是對同等重要地位的操作風險作並行監督控制。

在信用風險控制方面,尚且存在的問題主要體現在不良貸款率,即違約貸款率。從2008到2015年間,我國商業銀行的不良貸款餘額的年末存量和不良貸款率出現了雙降的現象,而從2008年貨幣政策改革和商業銀行股改的經濟背景來看,這種雙降實際上是得益於大背景下商業銀行計量方法的改變和不良貸款的剝離的。

在操作風險控制方面,樊欣、楊曉光(2003年)指出,操作風險的出現,主要是由業務中斷及系統失敗、客戶產品及業務操作、交割執行及流程管理、內部欺詐和外部欺詐五個方面的原因造成的。不管是從操作風險的損失事件的統計數字上看,還是從損失金額上看,內部欺詐和外部欺詐是近十年來造成操作風險的最主要的兩個原因,損失事件數佔比高達79%。而損失金額甚至接近100%。內外部欺詐的大案要案屢禁不止,引起全社會的反響,因此,操作風險得到政府和學者越來越多的重視,並將其列為金融風險控制的第二大風險。

楊望:大數據重塑風控新格局


圖 1我國商業銀行操作風險損失事件統計表

數據來源:樊欣、楊曉光《從媒體報道看我國商業銀行操作風險狀況》

在市場風險控制方面,我國市場化的步伐在上一輪經濟快速增長的過程中日益加快。與此同時,不確定因素的湧現,無疑增加了市場風險發生的可能性。市場化發展創新的核心手段是利率市場化和匯率機制改革。在市場化改革過程中,各類金融工具不斷更新,傳統金融風控模式下的各類業務也得以快速拓展,隨之而來的是由利率、匯率、商品價格和股價指數等因素引起的市場風險。當前,利率市場化和匯率敞口所帶來的風險問題是傳統金融風控過程中所面臨的主要問題。

傳統金融風控模式的優化路徑

信用風險、操作風險和市場風險是目前我國金融風控模式主要考慮的三類風險。深入探討傳統金融風控模式尚存的幾大問題,可以得出以下優化路徑:

一是金融體制不健全和金融監管不到位,我國目前正通過完善金融法律法規、完善資本市場建設來加強外部監管、分散商業銀行的風險,從而達到全面提高風險監管水平的目標。

二是經濟增長模式差和社會誠信水平低。供給側改革的國家戰略對經濟結構的調整,讓經濟增長日益合理化、穩定化。以央行為代表的金融監管機構、以阿里芝麻信用為代表的互聯網金融企業正在通過建立健全的社會徵信系統來降低信用風險。

三是風險管理文化缺失和高素質風控人才匱乏。風險管理意識的淡薄,或是風險控制意識不強,最直接的後果是造成金融機構的倒閉。比如擁有百年曆史的巴林銀行就是因為其高管裡森不顧風險的投資行為一夜倒閉。因此,近年來,我國商業銀行非常注重良好的風險控制理念的營造和高素質風控人才的培養。

四是風險控制方法單一,風險管理系統落後。

基於前三點優化路徑是金融風控模式的外部軟性解決方案,與法律法規相關性較強,金融企業無法短時間內完全優化。因此,筆者將著重分析第四點優化路徑。況且,互聯網對傳統金融業務模式的衝擊是巨大的,在我國普惠金融國家戰略的普及,小額化、分散化需求的日益旺盛,使傳統金融機構和互聯網企業都在尋求金融風控模式的創新。近年來,大數據技術的發展,極大地推動了傳統金融風控模式的變革,商業銀行代表的傳統金融風控模式的升級改造在所難免。

傳統風控模式中,大部分商業銀行沿用的都是以程控交換為主的風險管理系統,雖然穩定性較強,但是客戶容納體量有限、交易通訊指令複雜等不足讓商業銀行難以滿足現代投融資需求,特別是全國7000萬中小微企業的存貸款需求,早已突破了傳統風控模式的壓力測試、欺詐檢測和風險監管的系統容量上限。需求促進創新,伴隨著近年來互聯網思維的普及和互聯網技術的發展,商業銀行等傳統金融機構正準備將程控交換系統轉換成IP網絡為主的互聯網風險控制系統。硬件系統的搭建,正是基於大數據風控技術的研發需求而來。大數據風控逐漸成為金融機構創新傳統金融風控模式的變革利器。

大數據在金融風控中的探索與實踐

金融的中心是風控,風控的核心在於信息管理。歷經近一個多世紀的經營發展,國際先進的金融機構均已建立起了完整的風險管理信息系統。目前,我國的授信基礎數據尚存在大而不全、泛而不實的問題,特別是商業銀行為代表的傳統金融機構、螞蟻金服為代表的互聯網金融企業和中誠信為代表的徵信機構各自為營,圍繞自身互聯網平臺和業務系統,打造了生態大數據。然而,互不共享的原則讓其成為了數據孤島,成為了大數據風控技術普及過程中最大的攔路虎。不過,隨著金融監管機構對大數據風控模式的大力推廣,互聯互通政策的貫徹,相信不久的未來,我國的大數據風控模式也能被更多的金融企業採用,使其更有效地服務於實體經濟。

大數據風控模式的應用原則

大數據風控最核心的原則就是小額和分散,即避免資金相關者過度集中。業內形象的比喻就是將雞蛋隨機地分散放置於不同的菜籃裡。

小額的設計原則主要是針對海量數據構成的統計樣本,儘量地避免統計學中的 “小樣本偏差”。具體如互聯網平臺需要做總量為1億的借款業務。如果人均借款4000,那麼總共會是2.5萬個借款人;另外一種較為集中的情況是,如果人均借款100萬,那麼總共會是100個借款人。又假設借款人壞賬率是1%,那麼貸款給2.5萬個借款人的壞賬可能性會遠高於100個借款人的情況,但是,貸款給100個借款人的壞賬集中度非常高,極有可能達到10%,形象地說,就是100個人中有10個人極有可能違約。這就是統計學上常說的“小樣本偏差風險”。並且,第一種情況明顯更符合統計學的“大數定理”,樣本量足夠大的前提下,更符合正態分佈定律,理論上結構更加穩定。

分散的設計原則主要是通過分析借款主體的基本特徵、社會屬性、社交屬性等行為數據來建立大數據風控模型。並由此進行風險定價和決策放貸,目的是在一定程度上降低獨立個體同時違約的概率。例如,某P2P平臺歷史數據顯示,10個獨立的借款個體的違約概率是30%。那麼,n個互相獨立的個體同時違約的概率就是30%的n次方。又假設這n個人存在正相關性,小明違約時,小明的好友小紅也會違約的概率是60%,那隨機挑選出來的兩個人同時違約概率就會高達18%,即30%與60%的乘積。這就比兩者不相關的同時違約概率30%的平方,即9%高出整整一倍。由此可見,分散的原則在大數據風控模式中的重要性不言而喻。

小額和分散的設計原則固然有利於化解風險,但其借貸客戶產生的海量數據,已不是傳統的金融風控系統所能承受。由此,利用大數據分析和挖掘技術的大數據風控模式應時而生。最典型的成功案例是目前全球最大的P2P平臺——LendingClub。其利用已有的FICO評分,建立大數據風控模型,核心是自動化的決策引擎和評分卡體系,它可以根據客戶各方面的行為數據在1-10分鐘內判斷違約風險,並進行放貸,這種大數據風控模式其實就是我們耳熟能詳的信貸工廠模式。這種模式的好處在於能極大地降低成本、提高決策自動化程度、極速放貸。

大數據風控模式的實踐案例

目前,全國金融企業正在積極探索大數據風控模式的實際業務應用,特別是互聯網企業,其大部分的時間都花在了收集信用數據、分析和挖掘用戶價值等工作上。

大數據風控模式最大的瓶頸在於數據來源。已有的徵信體系中最可靠的就是中國人民銀行的徵信系統了,據最新數據顯示,央行徵信系統收錄8.7億自然人和2102萬戶企業等的數據。與全國13.5億自然人和7000萬中小微企業的總量相比,相差甚遠,特別是企業數據。況且,央行徵信系統的數據來源存在以下幾方面不足:一是隻對商業銀行等傳統金融機構開放,互聯網企業也僅有騰訊一家。對其他金融企業的接口限制將從很大程度上影響到大數據風控模式的有效性。二是數據質量問題。互聯網數據雖然大而龐雜,但是真實性確實有待考證。部分自然人在填寫徵信註冊信息時有意隱瞞或錯報,讓徵信系統的數據真實性大打折扣,也將直接影響到大數據風控對這部分自然人的判定結果。那麼,如何才能保證徵信數據真實有效呢?也許,目前最直接的解決方案就是交叉檢驗各個線上線下渠道收集的大數據。

在央行等監管部門的積極倡導下,我國商業銀行、互聯網公司、互聯網金融企業和第三方徵信機構正在尋求信用數據接口並用的合作方式。伴隨著全網大數據共享時代的到來,互聯網動態數據勾勒的信用家族圖譜也會越發清晰透明。

在大數據風控模式的數據來源中,電商大數據和生活服務類大數據所佔的比重是比較大的。電商大數據最成功的例子是阿里巴巴。其利用旗下B2B和B2C電商平臺阿里巴巴、淘寶、天貓及第三方支付提供商支付寶等積累的大量交易和支付數據作為大數據風控最基本的數據原料,再利用平臺商家的銷售信用數據、銀行流水及部分水電煤燃氣等生活服務類數據作為外部輔助數據原料。大量真實有效的電商大數據是阿里巴巴大數據風控模型成功運行的最堅實的基礎。生活服務類的大數據,商業銀行的數據最全面的,如水電煤、燃氣、物業、取暖、有線電視、電話充值、網絡寬帶等數據都是綁定個人基本身份信息的,真實度非常高,因此,生活服務類大數據是徵信系統中非常重要的一種數據類型。

小貸、銀行卡、信用卡類大數據的收集均是以國資系金融機構見長。例如國資系P2P平臺的典型代表——開鑫貸。開鑫貸由國家開發銀行的子公司國開金融、江蘇信託和江蘇省再擔保等江蘇省內國有企業共同投資設立。其特殊的國資背景可以讓開鑫貸輕鬆收集江蘇省內49家信用評級在A級以上的小貸公司的交易數據和江蘇省內銀行交易數據。

社交數據和搜索數據的有效真實性在業界尚處於驗證探索期。目前,騰訊微信和百度搜索都與商業銀行成立了合資公司,其目的在於提供大數據互聯互通的解決方案,試行大數據風控模式和大數據精準營銷。在數據來源不再困擾金融企業以後,大數據風控模式就可以進入到實質性應用階段,對收集來的信用大數據進行加工處理。近年來,阿里巴巴依靠自身平臺的長期積累,打造了國內頂尖的大數據風險控制系統。其優勢在於:

第一、海量的信用數據來源。據2015年阿里巴巴集團財報顯示,活躍用戶數已經達到4.07億,而我國網絡購物用戶不過4.13億。全中國98.5%的網購用戶均是阿里的用戶。與此同時,企業客戶也超過了8000萬。阿里巴巴的大數據幾乎覆蓋了現有的電商、社交、生活服務等領域的信用數據。這固然反映了阿里巴巴信息採集能力的強大。

第二、可靠性比較高的信息數據。2015年,阿里巴巴的電商交易額(GMV)繼續平穩增加,達到2.95萬億,佔據90%左右的網絡零售市場。體量巨大的交易額,無疑讓阿里巴巴採集的大數據比第三方徵信機構的大數據更加廣泛,更加貼近交易和支付環節,甚至可以說比央行徵信系統的信用數據更加詳實、更有活性。

第三、穩健的風險控制能力。經過與銀行、基金等傳統金融機構的合作,阿里巴巴已經結合內外部優勢研發出更符合大數據時代的風險控制系統。風控覆蓋貸款前、中、後三個階段。從2006年最早的支付寶簡易賬戶系統到現在阿里小貸的俗稱“水文模型”的智能實時監控系統,阿里巴巴穩健的風險控制能力經歷了十年的磨練,一直被業界津津樂道。值得一提的是,傳統金融機構也在不斷地認可阿里巴巴的大數據風控模式,通過產品組合、投資外包等方式來深化改進自有的傳統金融風控模式。例如,2014年7月22日,阿里巴巴與中行、招行、建行、平安、郵儲、上海銀行、興業銀行7家銀行宣佈深度合作推出網商貸高級版等產品;

第四、高效實用的信貸模型。在阿里小貸,申請、審查、監控、交易等信貸流程全在互聯網完成,從借款到放貸,全程1-10分鐘。如此高效的信貸流水線,不僅完美地改善了傳統金融風控信貸流程長、手續繁瑣等問題,而且最大限度地降低了借貸雙方的信貸成本和時間成本。郭功文、晨曉在《阿里金融PK商業銀行》裡指出:通常商業銀行客戶經理最多能管理100家小微企業,阿里小貸信貸經理已經提升到1000家以上。而銀行單筆信貸成本在2000元左右,阿里小貸只有2.3元。

正如李瑞冬在《中小微企業網絡融資問題研究》提到的一樣,阿里小貸已經成為這一領域極具代表性的模式。如此驚人的創新源於阿里巴巴先進的大數據風控模式。其風控系統的業務流程如圖2所示:

楊望:大數據重塑風控新格局


圖 2 阿里小貸大數據風控模式結構圖

第一步,先通過阿里巴巴公司的阿里媽媽、阿里巴巴等B2B和淘寶、天貓、花唄、阿里旅行、淘點點等B2C電子商務平臺收集互聯網用戶累積沉澱的交易大數據,並利用在線視頻技術實現客戶資信狀況的全方位調查,調查處理部分噪音數據後,將其和支付寶等支付平臺的支付大數據及生活服務類大數據進行模式匹配,建立大數據風控模型,即大數據授信審貸模型——水文模型。

第二步, 阿里小貸的主要類型有淘寶貸款和阿里貸款,提供的服務有淘寶或天貓信用貸款、電商訂單貸款及阿里信用貸款。客戶主要面向阿里電商平臺的店鋪商家,所以阿里小貸可以輕易獲得客戶的歷史數據。這些歷史數據的驗證是利用交叉驗證技術來實現的,數據的真實性還需要第三方同類型店鋪或社交數據進行輔助驗證。比如,假設淘寶上賣游泳設備的某一個商家只有夏季的銷售業績最好,這個商家對外的投放額度也會隨之增長。通過阿里小貸的水文模型,可以將此商家的數據進行同比和環比分析,驗證數據和決策的準確度,進而向店鋪發放合適的貸款額度。值得一提的是,阿里小貸的評分卡體系是通過沙盤推演技術和機器學習模型進行確立的,風控系統的決策引擎和量化定價分析都與其有相關性。

第三,阿里小貸的水文模型分為貸款前、貸款中、貸款後、市場分析、信用體系和反欺詐六個創新研究板塊。在其實時風險監管方面,研發了一套網絡人際爬蟲系統,可以不間斷地捕捉人際關係信息,通過關係映射還原成跨地域跨時間的信用評價,與專家規則進行匹配和關聯分析,最終出具大數據風控報告,供風險管理系統作出相應自動化決策。

原刊於《長江大數據》2016年10月


分享到:


相關文章: