消金江湖之反欺诈

消金江湖之反欺诈

引子


伴随肺炎疫情,消费金融行业最近并不安生。各路媒体薅羊毛、蹭热点、夹私货的不少。其中,最受追捧之一就是预言行业发展前景,意淫资产质量波动。


拐点还没到,资产质量波动究竟几何?除了各机构风控、高层和对应的监管机构,能被媒体知晓并报道的,基本都是放长线,狠打脸。


猎奇信息快餐,传播焦虑,不如来探究影响资产波动的原因,最重要的一个便是欺诈风险倍增。


在消金风控江湖里,信用风险和欺诈风险,一个是罗纱掩面却光明正大的挑战者,另外一个则是藏身暗处且招招致命的刺杀者。


如前篇所述,信用风险主要通过各种方法判断用户的还款能力和还款意愿。它就在那里,等你用可触及的手段搜索数据,用逻辑工具分析判断,最后在风险与利润之间寻求平衡。


欺诈风险,则完全不同。刺杀本就不择手段,杀人成功、绝尘而去才是惯见场面。贷款欺诈的目的是骗贷,所以反欺诈更像一场敌暗我明的不对称战斗。剑一出鞘,必鲜血侍之。


欺诈分类


兵者云:知己知彼,百战不殆。欲反欺诈,必先知之。欺诈风险,大致如下。


白户风险:借款人信息缺失,没有足够的数据来对借款人进行风险评估。包括内部白户(新注册用户、无申贷历史记录)和外部白户(央行征信、第三方民间征信无覆盖)。由于从未或较少有申贷记录,因此黑名单规则、多头规则等都会失效。在对待白户时,应当谨慎其被黑产利用的可能。


黑户风险:借款人存在逾期、失信、欺诈的记录。包括内部黑户(历史多笔订单出现逾期、在途订单催收失联等)、外部黑户(央行征信花/黑、第三方民间征信黑)。出于炫耀等心理,很多黑户会在口子论坛、QQ群等交流撸贷经验,因此可通过论坛舆情监控、黑产群卧底等来发现新的作案手法。


伪造风险:借款人通过伪造资料,蓄意骗贷。例如,伪造账单流水记录来企图骗取更高的额度。一般都是借款老手,熟悉各平台流程,深谙套路。恶意欺诈人群往往到处借钱,广撒网来提高放款概率。同时,可能涉及不良嗜好(黄赌毒)。


身份冒用:伪冒他人身份进行欺诈骗贷。包括熟人冒用(亲戚朋友、同学等)和他人盗用(购买他人四件套、个人隐私信息泄漏等)。一般可通过信审、人脸识别、活体验证等方式来核验借款人身份。


中介风险:黑中介哄骗或招揽客户实施骗贷,对平台风控漏洞进行大规模攻击,造成巨大资损。黑中介可利用白户轻松突破风控防线,并骗取白户的高额手续费。黑中介通讯录一般会存客户的号码;若是远程贷款操作,可能会采取视频通话、翻拍照片来应对活体识别核身。


传销风险:有组织地开展收费并发展多级下线,存在集中骗贷的风险。给成员洗脑诱导骗贷,同时不断以拉新会员费来给老会员发工资,从而扩大规模。由于老客拉新,从关系网络上观察具有明显的星状结构。


内外勾结:骗贷人与放贷机构内部员工因为利益勾结。机构员工熟悉内部风控规则和漏洞,利用这些漏洞与外部骗贷者合作,诱骗风控审核通过,骗取贷款本金。内外勾结一般是窝案居多,外部偏带者多为专业黑产、骗贷机构。单笔金额较大,且连续笔数多。


反欺诈体系


高手过招,七步之内,生死立判。反欺诈作为风控体系中不可逾越的底线,与信用风险控制体系截然不同,它的逻辑体系可谓极简:凡识别为欺诈者,斩立决。


决胜千里,在运筹帷幄。如果说反欺诈的策略是道,那么反欺诈的模型和算法就是法和术。道、法、术由上至下,辅成与共。而数据,作为一切逻辑得以实现的基石,就像空气、时间或者重力。四者合璧,形成反欺诈的闭环世界。


反欺诈策略


在反欺诈的世界里,华山论剑的侠客不少,杀敌制胜的招数无限。反欺诈策略,更像是习武最初修炼的内功心法。当内力盈满,无论何门何派武功,学起来都会事半功倍。主流的反欺诈策略有信誉库、专家规则、机器学习三种。


❖ 信誉库:指传统的黑、白名单,通过内部积累、外部获取的各种人员、手机号、设备、IP等黑白名单对欺诈行为进行判断,是一种简单、成本低的反欺诈手段。


❖ 专家规则:基于反欺诈策略人员的经验和教训,制定反欺诈规则。当用户的操作请求和行为触发规则时,即被认定为欺诈行为并启动拦截。


❖ 机器学习:通过机器学习的方法,将用户各个维度的数据和特征,与欺诈建立起关联关系,并推算出欺诈的概率。


有监督的机器学习会将历史上出现的欺诈行为进行标记,利用逻辑回归等算法,结合海量用户行为特征,识别欺诈行为。


无监督的机器学习不需要预先标记欺诈行为,而是通过对有操作行为各维度数据和标签聚类,找出差异行为,予以拦截。


反欺诈模型与算法


内功内化于心,拳术剑法外化于形,内外兼修,方能制胜。反欺诈模型就像武林各派武功,而算法就像纷繁复杂的招式。终极目的为制胜,在反欺诈的江湖里,从一而终者寡,而杂糅百家、取长补短者多。


❖ 常用的模型 有FPD模型、评分卡模型、多元判别分析模型、Logistic回归模型、神经网络模型、决策树模型等。


举例:FPD (First Payment Delinquency)首次还款逾期模型通常作为兜底模型,内在原因是欺诈一旦得逞,首次还款即逾期,所以首逾率也通常被视作欺诈的一个重要指标。


❖ 常见的算法 包括数据挖掘算法、社区发现算法、深度学习算法等。


举例:数据挖掘算法是根据数据创建数据挖掘模型的一组试探法和计算。为了创建模型,算法将首先分析提供的数据,并查找特定类型的模式和趋势。


(大)数据


道生一,一生二,二生三,三生万物 -- 《道德经》。在反欺诈体系里,数据就是一。


❖ 前篇文章里详述大数据的分类,涵盖资质数据、社交数据、交易数据、行为数据等,不再赘述。


而数据之所以为基石,是因为多数实际情况下,数据的量级并不能达到理想要求。底层的算法、模型和策略需要根据数据的可获得性调整。反之,对数据清洗和使用的逻辑,会对产出的结果造成实质影响。


举例:关于社交数据如通讯录、运营商数据,采用基于图的社区发现算法(如Louvain)来发现团伙。关于埋点行为数据,利用LSTM、Word2Vec等算法来生成行为特征。


典型风险事件渠道


兵者,诡道也 -- 《孙子兵法》


反欺诈模型的迭代和欺诈黑产的反制更新,就是一场典型的猫鼠游戏。无间之道,没有成规可寻。在反欺诈体系之外,可用四种渠道窥视敌方动向。


消金江湖之反欺诈


实时大盘监控:基于订单、用户维度,监控设备聚集性风险(LBS、Wi-Fi)、地域欺诈风险(如朋克村)。大盘监控对于识别黑中介风险、传销风险等团伙欺诈相对更有效,需要设置报警阈值,并人工介入分析。


信审催收反馈:信审通过电话外呼,核验客户身份,咨询借款动机,往往会发现某些欺诈用户。例如,身份伪冒风险场景中,借款人支支吾吾无法正确回答问题。催收中发现失联用户等,这些关联部门的案件将反馈至风控调研组。


论坛舆情监控:通过对各大口子论坛、戒赌吧、上岸交流区等内容,提取近期市场动向。特别是需要去理解欺诈人群的心理特征、社会身份等。例如,2018年,在714高炮行业风险初见苗头时,论坛上就出现“青铜系”、“宁波系”等借贷口子系列。


黑产卧底调研:线上渠道可尝试加撸口子QQ群、网贷中介微信等方式,利用老手们的集体智慧,以及网贷中介的丰富经验。站在对方的立场上,更会发现己方风控系统的弱点。线下渠道可去一些欺诈案件多发地,实地调研来学习黑产的手法。


尾声


有人的地方就有江湖,有江湖的地方就有欺诈。人心有多善良,就有多险恶。欺诈与反欺诈,是人性的较量,不灭不息,永恒存续。认清这点,许多事自然得解。


最后分享一个彩蛋故事,关于人类与技术反向破解。


一个有严重路怒症的德国老头,每次开车出门时,后座上总是堆叠着99部旧手机,全部打开谷歌地图。当聪明人用最智能的手机实时查询交通路况,用最复杂高效的算法算出最优路线,从而节省5分钟时,老头却一路驰骋,悠然驶向目的地。

消金江湖之反欺诈


分享到:


相關文章: