荐书|智能风控:原理、算法与工程实践

荐书|智能风控:原理、算法与工程实践

图书简介

风控领域是新兴的机器学习应用场景之一,其特点包括了负样本占比极少、业务对模型解释性要求偏高、业务模型多样、风控数据源丰富等。

《智能风控:原理、算法与工程实践》一书共 8 章,包含 26 种解决方案,分别介绍了自动化规则挖掘、集成模型评分卡、项目冷启动、幸存者偏差、不均衡学习、异常检测、模型优化、网络挖掘等方向所面临的问题,同时利用决策树、集成学习、迁移学习、无监督学习、半监督学习、模型融合、深度学习、图算法等机器学习模型对其进行改善,帮助读者更好、更快地解决实际的建模问题。本书由机械工业出版社于2019年12月出版。

梅子行,男,历任多家金融科技公司风控算法研究员、数据挖掘工程师等职位。现供职于智能物流独角兽公司——满帮科技。

师承Experian、Discover等风控专家。擅长深度学习、复杂网络、迁移学习、异常检测等非传统机器学习方法。热衷于数据挖掘以及算法的跨领域优化实践。

图书目录

前言

第 1 章 风控建模与规则挖掘 / 1

1.1 信贷与风险 / 1

1.1.1 信贷业务与互联网金融风控体系 / 1

1.1.2 信贷风险与控制 / 4

1.2 工业建模流程 / 5

1.2.1 抽象业务 / 6

1.2.2 定义标签 / 6

1.2.3 样本选取 / 7

1.2.4 特征工程与模型调优 / 7

1.2.5 上线监控与评估报表 / 8

1.3 规则挖掘方案 / 11

1.4 本章小结 / 18

第 2 章 集成模型评分卡 / 19

2.1 特征工程解析 / 19

2.1.1 特征与模型 / 20

2.1.2 信用模型的特征 / 20

2.2 特征衍生方案 / 22

2.3 离散处理 / 24

2.3.1 one-hot编码 / 25

2.3.2 WOE编码 / 26

2.4 迭代特征筛选方案 / 31

2.5 自动化调参 / 36

2.5.1 自动化调参策略 / 37

2.5.2 参数搜索方案 / 37

2.5.3 调参框架搭建 / 38

2.6 递归特征删除方案 / 41

2.7 评分卡制作 / 43

2.7.1 逻辑回归评分卡 / 43

2.7.2 集成模型的评分映射 / 53

2.8 本章小结 / 58

第 3 章 迁移学习与冷启动 / 59

3.1 迁移学习基础 / 59

3.1.1 应用场景 / 60

3.1.2 概念介绍 / 60

3.2 迁移学习方法论 / 61

3.2.1 三类常见算法 / 61

3.2.2 迁移的实现方法 / 62

3.3 少量有标签样本的迁移方案 / 63

3.3.1 TrAdaBoost模型 / 63

3.3.2 跨场景迁移模型 / 65

3.4 无标签样本迁移之 JDA / 74

3.4.1 JDA模型 / 74

3.4.2 模型应用 / 77

3.5 无标签样本迁移之 DTELM / 80

3.5.1 ELM模型 / 80

3.5.2 DTELM模型 / 81

3.5.3 模型应用 / 83

3.6 迁移样本筛选方案 / 88

3.6.1 背景介绍 / 88

3.6.2 算法框架概览 / 88

3.6.3 搭建融合框架 / 88

3.7 本章小结 / 93

第 4 章 幸存者偏差 / 94

4.1 幸存者偏差的含义 / 94

4.2 增量学习 / 95

4.3 生成对抗网络 / 96

4.3.1 GAN模型介绍 / 97

4.3.2 GAN与幸存者偏差 / 98

4.4 高斯聚类模型 / 99

4.4.1 GMM算法原理 / 99

4.4.2 GMM简单应用 / 102

4.4.3 GMM中的概率模型 / 102

4.4.4 GMM样本生成 / 106

4.5 信息准则 / 108

4.5.1 赤池信息准则 / 109

4.5.2 贝叶斯信息准则 / 109

4.5.3 AIC与BIC比较 / 110

4.6 本章小结 / 111

第 5 章 不均衡学习 / 112

5.1 样本不均衡 / 112

5.2 代价敏感加权方案 / 113

5.3 插值过采样方案 / 114

5.3.1 SMOTE算法 / 114

5.3.2 过采样算法实践 / 115

5.4 半监督学习方案 / 120

5.4.1 前提假设 / 121

5.4.2 S3VM / 121

5.4.3 LP / 125

5.5 本章小结 / 129

第 6 章 异常检测 / 130

6.1 离群点与欺诈检测 / 130

6.2 z-score检验 / 131

6.3 LOF异常检测法 / 132

6.3.1 原理与算法流程 / 132

6.3.2 LOF样本清洗方案 / 134

6.4 IF异常检测法 / 137

6.4.1 原理与算法流程 / 137

6.4.2 PreA模型与冷启动 / 139

6.5 本章小结 / 141

第 7 章 模型优化 / 142

7.1 多损失函数分段预测 / 142

7.1.1 2种损失函数 / 143

7.1.2 融合流程 / 143

7.2 树模型特征衍生 / 145

7.2.1 GBDT离散化 / 146

7.2.2 融合方案详解 / 146

7.2.3 特征衍生细节 / 147

7.2.4 案例 / 148

7.3 时间序列建模 / 156

7.3.1 RNN / 157

7.3.2 LSTM / 160

7.3.3 门控结构 / 161

7.3.4 LSTM行为评分卡案例 / 163

7.4 高维稀疏数据建模 / 167

7.4.1 算法原理 / 167

7.4.2 算法应用 / 169

7.5 模型融合 / 171

7.5.1 模型融合基础 / 171

7.5.2 模型筛选 / 172

7.6 本章小结 / 179

第 8 章 知识图谱 / 180

8.1 复杂网络基础 / 180

8.2 中心度与相似性 / 183

8.3 节点分类 / 189

8.3.1 朴素节点分类 / 189

8.3.2 邻节点加权投票 / 191

8.3.3 一致性标签传播 / 193

8.4 社区发现算法 / 196

8.4.1 基础概念 / 196

8.4.2 Girvan-Newman算法 / 197

8.4.3 Louvain算法 / 199

8.4.4 社区评估 / 200

8.5 网络表示学习 / 202

8.5.1 矩阵分解 / 203

8.5.2 节点嵌入 / 207

8.6 图卷积神经网络 / 211

8.6.1 卷积神经网络 / 211

8.6.2 傅里叶变换 / 213

8.6.3 拉普拉斯算子 / 215

8.6.4 GCN中的图卷积 / 217

8.6 本章小结 / 221

参考文献 / 222


分享到:


相關文章: