在風控規則的梳理中,人行徵信數據是非常重要的模塊,特別是對持牌金融機構而言,徵信數據就是最重要的外部數據源。對接好,徵信數據之後,下一步就是需要將報告中的字段梳理成各種符合業務邏輯的變量。如何梳理具體的徵信報告數據?我們為各位讀者分享人行報告的變量數據。
此係列文章分為上下篇,此篇為上篇為各位介紹一代人行徵信報告的變量梳理。下篇將為各位讀者介紹二代徵信報告的相關內容。
在之前文章中,我們提到一份完整的徵信報告包括的內容,具體報告內容如下:
細細梳理,任何關於一份徵信的內容,主要包括的內容如下:
以上三個模板的字段信息,我們進一步梳理成一下具體的變量細則,對應輸出的變量的名稱與變量的邏輯如下:
貸款方面
貸款方面的數據,根據徵信的情況,可以按照逾期的狀態跟逾期的天數交叉結合成不同時間切片的數據,具體我們可以衍生出以下的變量的邏輯,即為多長時間內,還款記錄中逾期狀態的出現某狀態的次數,以下我們舉例說明:
1.貸款最近3個還款期出現M1(逾期1-30天)或以上的記錄次數:
ap_pbc_loanlist(row)貸款明細中,每筆貸款做以下條件判斷,返回滿足條件的次數(每筆求和);
條件為:最近三個月還款記錄是否出現>=1
2.貸款最近3個還款期出現M2(逾期31-60天)或以上的記錄次數:
ap_pbc_loanlist(row)貸款明細中,每筆貸款做以下條件判斷,返回滿足條件的次數(每筆求和);
條件為:最近三個月還款記錄是否出現>=2
....
3.貸款最近6個還款期出現M1(逾期1-30天)或以上的記錄次數:
ap_pbc_loanlist(row)貸款明細中,每筆貸款做以下條件判斷,返回滿足條件的次數(每筆求和);
條件為:最近六個月還款記錄是否出現>=1
….
貸記卡方面
類比貸款的內容,將貸記卡的信息,也按照時間跟逾期的狀態衍生出以下方面的內容:
1.貸記卡最近3個還款期出現M1(逾期1-30天)或以上的記錄筆數:
ap_pbc_creditlist(row)信用卡明細中,每張貸記卡做以下條件判斷,返回滿足條件的次數(每筆求和);
條件為:最近三個月還款記錄是否出現>=1
……
2.貸記卡最近3個還款期出現M3(逾期61-90天)或以上的記錄次數
ap_pbc_creditlist(row)信用卡明細中,每張貸記卡做以下條件判斷,返回滿足條件的次數(每筆求和);
條件為:最近三個月還款記錄是否出現>=2
……
其他方面
徵信數據中,其他方面的數據有一部分是包括在貸款跟貸記卡的信息裡面,但因為這些變量在做規則和模型中,信息熵大,所以單獨拎出來做成某些規則:
1.是否有未結清汽車貸款且最近3個月有過逾期:
ap_pbc_loanlist(row)貸款明細中account_state_name賬戶狀態<>結清+loan_type_name貸款類型=個人汽車貸款+近三個月逾期(邏輯為非N,*)
2.未結清貸款筆數:
取ap_pbc_shareanddebtsum(row)中,share_name=未結清貸款時,account_count的值
3.當前是否有未結清助學貸款:
ap_pbc_loanlist(row)貸款明細中 account_state_name賬戶狀態<>結清+loan_type_name貸款類型=個人助學貸款
最後本篇文章所提及的徵信報告以及對於的徵信的數據變量字段,我們都梳理成具體的字段都統一上傳到知識星球上,大家可以上去查閱,謝謝。
閱讀更多 番茄風控大數據 的文章