人行徵信報告(上)——一代徵信報告的變量梳理

在風控規則的梳理中,人行徵信數據是非常重要的模塊,特別是對持牌金融機構而言,徵信數據就是最重要的外部數據源。對接好,徵信數據之後,下一步就是需要將報告中的字段梳理成各種符合業務邏輯的變量。如何梳理具體的徵信報告數據?我們為各位讀者分享人行報告的變量數據。

此係列文章分為上下篇,此篇為上篇為各位介紹一代人行徵信報告的變量梳理。下篇將為各位讀者介紹二代徵信報告的相關內容。

在之前文章中,我們提到一份完整的徵信報告包括的內容,具體報告內容如下:

人行徵信報告(上)——一代徵信報告的變量梳理

細細梳理,任何關於一份徵信的內容,主要包括的內容如下:

人行徵信報告(上)——一代徵信報告的變量梳理

以上三個模板的字段信息,我們進一步梳理成一下具體的變量細則,對應輸出的變量的名稱與變量的邏輯如下:

貸款方面

貸款方面的數據,根據徵信的情況,可以按照逾期的狀態跟逾期的天數交叉結合成不同時間切片的數據,具體我們可以衍生出以下的變量的邏輯,即為多長時間內,還款記錄中逾期狀態的出現某狀態的次數,以下我們舉例說明:

1.貸款最近3個還款期出現M1(逾期1-30天)或以上的記錄次數:

ap_pbc_loanlist(row)貸款明細中,每筆貸款做以下條件判斷,返回滿足條件的次數(每筆求和);

條件為:最近三個月還款記錄是否出現>=1

2.貸款最近3個還款期出現M2(逾期31-60天)或以上的記錄次數:

ap_pbc_loanlist(row)貸款明細中,每筆貸款做以下條件判斷,返回滿足條件的次數(每筆求和);

條件為:最近三個月還款記錄是否出現>=2

....

3.貸款最近6個還款期出現M1(逾期1-30天)或以上的記錄次數:

ap_pbc_loanlist(row)貸款明細中,每筆貸款做以下條件判斷,返回滿足條件的次數(每筆求和);

條件為:最近六個月還款記錄是否出現>=1

….

貸記卡方面

類比貸款的內容,將貸記卡的信息,也按照時間跟逾期的狀態衍生出以下方面的內容:

1.貸記卡最近3個還款期出現M1(逾期1-30天)或以上的記錄筆數:

ap_pbc_creditlist(row)信用卡明細中,每張貸記卡做以下條件判斷,返回滿足條件的次數(每筆求和);

條件為:最近三個月還款記錄是否出現>=1

……

2.貸記卡最近3個還款期出現M3(逾期61-90天)或以上的記錄次數

ap_pbc_creditlist(row)信用卡明細中,每張貸記卡做以下條件判斷,返回滿足條件的次數(每筆求和);

條件為:最近三個月還款記錄是否出現>=2

……

其他方面

徵信數據中,其他方面的數據有一部分是包括在貸款跟貸記卡的信息裡面,但因為這些變量在做規則和模型中,信息熵大,所以單獨拎出來做成某些規則:

1.是否有未結清汽車貸款且最近3個月有過逾期:

ap_pbc_loanlist(row)貸款明細中account_state_name賬戶狀態<>結清+loan_type_name貸款類型=個人汽車貸款+近三個月逾期(邏輯為非N,*)

2.未結清貸款筆數:

取ap_pbc_shareanddebtsum(row)中,share_name=未結清貸款時,account_count的值

3.當前是否有未結清助學貸款:

ap_pbc_loanlist(row)貸款明細中 account_state_name賬戶狀態<>結清+loan_type_name貸款類型=個人助學貸款

最後本篇文章所提及的徵信報告以及對於的徵信的數據變量字段,我們都梳理成具體的字段都統一上傳到知識星球上,大家可以上去查閱,謝謝。

人行徵信報告(上)——一代徵信報告的變量梳理

人行徵信報告(上)——一代徵信報告的變量梳理


分享到:


相關文章: