外部數據源的使用匯總

獲客成本、徵信數據成本,一直是國內眾多普惠金融疾行軍一塊隱性的、數目不低的成本。監管方面一直希望貸款類機構能真正踐行小額、分散的普惠金融之路,然而,如果放款機構的人均借款額只能維持在區區幾千元的水準線、貸款定價還不能過高,此外放款機構還要負擔數千萬級借款人、人均數十元的徵信查詢成本,對於本身以盈利為目的的商業機構來說,負擔並不算小。本系列的文章也嘗試著從外部數據的徵信費用談起,也跟大家介紹下目前外部數據徵信的的使用情況。

數據徵信成本已經成為成為一家公司重大的費用支出,我們先看一份筆者之前從事過的一個現金貸的業務,也是在當時剛起步的項目,因為剛起步所以接入的數據源不多,那自然所用的費用也不多,也算是在該項目的所有的流程中最便宜的一次費用了:

外部數據源的使用匯總

從上面的數據,可以看出來,一個客戶所有全查到數據的情況下,所花費的費用是九塊五。九塊五是什麼概念,是非常便宜的數據費用。因為在正常的線上貸款公司而言,需要核查一家公司從線上到獲客有效的整條產業鏈中,需要花費的費用大概就是20-50元的範圍。

據筆者瞭解到,單單徵信成本就佔到整個金融公司的2%-5%的費用支出。徵信成本太高,加上公司本來固定的運營成本、資金成本、人力成本各種亂七八糟的費用,一個產品的利息不達到24%以上,更有一些短期現金貸公司直到36%或以上,才能盈利,否則根本不賺錢了。

也基於這樣的業務的邏輯催生出那麼多的高利率的產品。徵信成本太高了,也是目前整個行業的通病。

目前也因為徵信成本過高,長期居高不下,每家公司在競爭角力上也一直在考慮如何優化相關的徵信費用,畢竟利潤已經有限,優化徵信成本已經是必須要調整的內容。

想了解如何優化目前的數據源,進一步思考,追源溯本,就該深入瞭解目前所用能用的數據。只有對比完相關的數據源才能瞭解這些數據是否屬於同質性的數據,源頭的數據是否雷同或者相似,是否互相能取代,只有一個一個地瞭解熟悉,才能知道哪些可以交互和取代。

從今天開始的系列開始,我們將會對這些外部徵信數據源,進行分析:

外部數據源的使用匯總

本系列的文章將分為幾個部分為各位讀者梳理目前市面上,常見的數據源,我們先從最常用的幾個數據源開始梳理:

TongDun

TongDun的數據無疑是目前市面上最能查到最全面的數據源了,因為他們家做數據產品相對較早。所以數據覆蓋率,在所有的數據廠家中最高的。但查得率是一回事,準確率是另外一回事。因為目前很多三方數據,其實都是無法考究真實性的。

央行徵信數據,權威、真實、合規,這些都是三方數據都無法比擬的,難怪說實名上的數據之分兩種,一種是央行徵信數據,另一種就是第三方,無論第三方徵信數據裡的第三方有多大。

比如對於銀行的大部分客群而言,銀行間只查詢銀行間的數據,很少或者較少會查詢非銀機構的數據情況。因為非銀機構的數據如何考究真偽就是個很重要的問題。但也不是每一家銀行對待三方數據的角度都一樣。從數據的參考來看,有些冒進些的銀行會加大對第三方數據的使用,但也僅僅是對方必須也同樣是持牌,受監管的單位。

相對地,非銀機構也是類似。一位客戶之前在小貸中申請過產品,在銀行間的數據中是非常好的客戶標籤,但是等到去非銀機構的時候,去發現該客戶的借款行為已經是強蒼百孔。

回到tongdun的徵信數據本身,其徵信接口是通過身份證和手機號碼所對應的內容,便能反饋到具體用戶的風險情況了,詳情如下:

外部數據源的使用匯總

再介紹以上相關的數據維度的之前,我們先介紹一個權重分的概念。

權重分

目前世面上所涉及到規則的使用情況,對於某些規則比如命中多頭或者黑名單類的強規則,我們一般不會一條規則名字就直接拒絕,一般會將每條規則賦予一個權重分。

同樣的,如果權重分的累加大於某個值之後,才會真正去拒絕該客戶,那權重分該怎麼賦分?

如果一般有貸後數據的就參考貸後數據,這個之前在我們的文章有提及(傳送門:重磅分享--基於違約概率跟odds的經驗評分),而如果是新產品或者新的業務,沒有具體的數據,就參考業內的方法,比如我們以身份證命中規則,整理彙總,情況如下:

身份證負面情況:

外部數據源的使用匯總

1.在強規則中第一梯隊的規則,其權重佔比也最高:


外部數據源的使用匯總

身份證格式校驗錯誤

身份格式有誤是在所有規則中權重排序最高的規則,因為格式有誤證明該身份證持有人身份無法識別,證明該身份證信息連信息都無法查找,所以需要重新拒絕進件。

身份證命中欠款公司法人代表名單

欠款法人有重大負債,已經無法再繼續經營項目,其他幾條在這裡的權重排位大致相同,就不明細

2.再繼續分析第二梯隊的身份證信息數據

外部數據源的使用匯總

存在欠費信息而且沒有嘗還,所以也跟第1級想類似,當然稍對比對應的權重仍弱於第一梯隊的規則

3.第三梯隊,涉及到較高風險,所以也是算較高風險的客群

外部數據源的使用匯總

4.較低風險的客群,對應如下:

外部數據源的使用匯總

這裡的得分情況為稍微最低,因為最低的得分不太有相關的金融屬性,所以所佔權重比相對較低
在梳理相關的權重的時候,我們能按照這樣的邏輯思路梳理:

身份證>手機號碼>其他聯繫方式>聯繫人>測試數據

下面再展開的這些項,大概也是按照這樣的方式進行梳理,請看——
二.我們繼續分析手機號跟其他內容的信息如下,手機號負面:

外部數據源的使用匯總

三.座機/QQ號/郵箱負面

外部數據源的使用匯總

四.其他類負面

外部數據源的使用匯總


五.關聯信息:

外部數據源的使用匯總

六.聯繫人近親黑名單

外部數據源的使用匯總

七.聯繫人一般身份黑名單

外部數據源的使用匯總

八.其他類風險:

外部數據源的使用匯總

九.多次申請風險:

外部數據源的使用匯總

十.申請人關聯信息過多:

外部數據源的使用匯總

十一. 測試類與預先埋伏類:

外部數據源的使用匯總


外部數據源的使用匯總

最後關於這份數據,會上傳到知識星球上,請有需要的學習的同學自行下載這份最全面的數據,謝謝。

外部數據源的使用匯總


微信公眾號&知識星球:番茄風控大數據


外部數據源的使用匯總


分享到:


相關文章: