檸檬科技肖勃飛:大數據風控黑科技是怎樣煉成的

5月29日,在鳳凰網WEMONEY北京舉辦的新金融行業風控SHOW上,檸檬科技聯合創始人、CTO肖勃飛,從檸檬科技的建立初心,針對市場的需求痛點,闡述了檸檬科技的產品系統路徑,為大家分享了檸檬科技作為一家專業的風控服務商對目前互聯網金融行業的觀察。

檸檬科技肖勃飛:大數據風控黑科技是怎樣煉成的

演講摘要分享:

大家好!很榮幸今天能夠代表檸檬科技站在這裡,與大家見面,在此,請允許我先做一個簡單的自我介紹。我是肖勃飛,作為檸檬科技的聯合創始人和CTO,過去十幾年裡一直從事大數據風控方面的工作。

早在上個世紀80年代,大數據就被著名未來學家阿爾文·托夫勒在《第三次浪潮》一書中讚頌為“第三次浪潮”。互聯網金融的崛起,更是將大數據推上了高潮。

建立檸檬科技的初心

有幸趕上中國互聯網金融崛起的時代,最開始我在京東負責交易風控。當時“信用價值”的概念還未普及,大家只知道在銀行金融服務之外,有龐大的用戶群體,他們有很強的金融需求,但是這群人的資質傳統金融機構看不上。而且他們的徵信數據嚴重缺失,就像是一個“黑洞”,這些人到底可以不可以借錢,他們有沒有能力和意願還錢,銀行不知道,所以不敢借,但數據讓互聯網金融機構可以區分他們……

在這樣的背景下,互聯網金融快速發展;但前期的野蠻生長也催生了一批以黃牛、薅羊毛、刷單、等方式牟利的“黑產”。

我當時有一個很強烈的感覺,就是這個市場急需一家懂傳統信貸風控,又懂大數據風控的專業風控服務商,去為整個行業的良性發展做出努力。很幸運,我和另外幾個創始人一拍即合,在2015年成立了檸檬科技,旨在為眾多互金企業、以及廣大的信貸金融機構提供大數據風控服務。

事實證明,目前我們已經可以通過大數據分析處理、機器學習和全流程的系統閉環,將消費信貸流轉的週期,從原來的2-4周縮短到3分鐘以內,綜合效率提升了數千倍。為什麼有這麼驚人的改變呢?今天可以從互聯網金融的五大核心環節開始講起。

互聯網金融的五大核心環節

我們知道導流、風控、業務系統、貸後及催收是互聯網金融的五大核心環節。從2013年-2017年中國泛線上信貸成本投入規模結構來看,線上獲客和大數據風控的投入在逐年增加。為什麼這兩部分最受金融機構的重視呢?因為引流獲客可以快速拓展業務,而投入大數據風控、搭建業務系統,則有利於降低風險,控制成本。這些都是金融科技為金融立身之本,檸檬科技選擇流量和風控這兩大塊,也是從核心上助力金融業務的發展。

檸檬科技肖勃飛:大數據風控黑科技是怎樣煉成的

而風控本身是一個複雜的業務流程。從貸前營銷到貸後管理,風控可以始終貫徹全程,涵蓋審批、授信、風險預警、貸後催收等各個業務環節;而對於風控本身來說,最重要的三個要素又是什麼?是“數據”“模型”和“系統”,數據是基礎,模型是能力,而系統便是支撐。我們接下來從數據、模型和產品三個維度來講風控為什麼難做。

互聯網金融風控的痛點

很多時候大家都在講風控、做風控,但如果缺少數據,就像房子失去的基石。由於行業的特殊性,在目前,公共數據對外開放有限,而且市場上缺乏一個標準統一、跨平臺分享的數據生態系統。可以說,數據信息的不對稱,導致對客戶貸不貸、貸多少的問題難以評估。

而在風控模型方面,對壞人的識別要達到一定的準確率和覆蓋率,而這兩個數據就像天平的兩端,很難達到平衡。要保證一定的準確率,把風險客戶識別出來,對模型能力的要求極高。而如果模型規則太簡單,就很容易誤殺真實的貸款客戶,也容易被詐騙團伙破解。我們常說,“不要放過一個壞人,也不能誤殺一個好人”,這個很難,但也非常重要。

檸檬科技肖勃飛:大數據風控黑科技是怎樣煉成的

我們以一個團伙集體採集信息進行騙貸為例進行說明:

某公司線上小額貸款產品APP,在公開對外推廣運營過程中發現,某一段時間申請的客戶存在部分集中逾期情況,風控人員在對這批客戶進行分析時發現,這批客戶所有的身份信息校驗結果均為真實,而且沒有黑名單記錄,歷史信用良好。進一步瞭解客戶留底採集的資料後發現,客戶拍的本人照片背景幾乎出至同一環境,類似酒店房間。這就有意思了,所有信息均是本人真實信息,唯一的破綻就是不起眼的照片背景。

問題是,很多分期的線下網點背景本就是相似的,單單把這背景相似作為一條識別欺詐的規則是正確的嗎?會誤殺正常的客戶嗎?這條規則上線後,證實又誤殺了很多正常的客戶。,所以一個簡單的數據模型是做不到這麼深入的分析的。這對風控模型的變化、迭代給出了越來越高的要求。

如何利用數據和模型

首先,我們要處理數據。第一步是加工清洗,形成歷史彙總指標、貸款申請人關係指標等,基於這些指標,形成識別客戶風險的特徵變量,來有效反應客戶的資產負債能力,消費習慣行為、社交關係、歷史徵信記錄等。數據維度越豐富,我們對客戶的瞭解越全面,客戶畫像越準確,對風險的識別就越準確。也就能識別出用戶對產品的真實需求,對貸款欺詐和逾期風險進行預測。

比如說,如果一個客戶收入水平很高,消費水平很高,消費對象為高端奢侈品,或者商品的品質都很高,我們可以給客戶打上一個金領的標籤。如果一個客戶收入水平很低,消費主要集中在衣食,那我們可以認為他可能是一個低收入人群。有了明確的客戶畫像後,我們便要通過這些標籤來識別客戶。如果一個有著金領標籤的客戶來進行消費分期,那麼客戶的消費能力和貸款需求就有一定的衝突,我們就可以懷疑這個客戶有騙貸的嫌疑。

檸檬科技肖勃飛:大數據風控黑科技是怎樣煉成的

而後,便要進入模型這個層次了。檸檬科技已訓練出包括欺詐評分卡、申請評分卡、催收評分卡等在內的完整的信貸模型體系,為貸前貸不貸,貸多少、貸後是否有逾期等提供決策支持。以反欺詐模型為例,我們主要關注地址一致性檢驗、黑名單庫、多重借貸;手機和銀行卡等形成的社交關係中是否存在歷史風險客戶。如果一個貸款申請人的通話記錄中,有多個聯繫人進行過借貸申請,或者其中有申請人是風險客戶,我們就可以懷疑這是一個專業的騙貸團伙。

在多年的風控服務中,檸檬科技針對風控的三個關鍵要素,也形成了自己的一套風控解決方案。

在數據層面:我們整合了包括運營商、社交網絡、行為軌跡、消費習慣、信用記錄等海量數據,結合分佈式大數據計算平臺,以及深度學習等技術,建立了上億的大數據中心,這是我們的數據能力;

在模型層面:我們開發了多個模型,通過機器學習,模型快速迭代,已經累計實現了60多個業務模型,幫助客戶完成了上千萬用戶的借款審核,近500億的資產風險管理;

在系統支撐層面:我們擁有“檸檬俠”風控雲平臺和“看家狗”貸後預警平臺。檸檬俠風控雲平臺可以幫助客戶實現授信定價、申請評分、反欺詐等風控模型的訓練、自動優化和部署,為信貸業務提供智能決策支持;而看家狗貸後預警平臺提供的是貸後行為的實時監控、逾期風險預警、催收管理等方面的支持。

檸檬科技圍繞數據、模型、和產品三層服務,實現了從實時數據接入、實時挖掘分析、實時風控服務、實時監控、實時模型優化的整個“自動化閉環”。通過數據中心對多維度海量數據進行處理分析形成數據集市;挖掘平臺利用數據挖掘算法為決策引擎自動生成決策樹、風控模型及評分卡;報表平臺提供系統運營報表及風控相關報表;最終為用戶提供定製化風控報告。

檸檬風控初露鋒芒

檸檬科技在過去幾年的時間裡,與銀行、金融機構緊密合作,我們的風控解決方案也獲得了業內的肯定,具有大數據和人工智能基因的“檸檬俠”,為風控服務提供了充分的活力。其“快、準、穩“的特點,實現了1秒在線審批,風控業務半個月快速上線,系統穩定運行2年的良好表現。為客戶的信貸業務降低了1%-5%的不良率,已經覆蓋了全場景的互金產品,支撐了500億+資產的風控。

迄今為止,檸檬科技已經服務了四川天府銀行、有利網等金融機構,並與北京大學、廈門大學、西南財經大學統計學院等高校和科研機構建立了深度研發合作關係。

檸檬科技肖勃飛:大數據風控黑科技是怎樣煉成的

大數據和互聯網金融儼然已經密不可分,互聯網金融的強勢蛻變,使得智能金融科技成為發展大勢。檸檬科技以技術與系統作支撐,賦能互聯網金融行業,助力行業高效可持續成長,最終實現合作共贏。

————————————————————————

小萌錢包,帶你快速掌握金融貸款行業最新資訊信息


分享到:


相關文章: