![荐书|智能风控:原理、算法与工程实践](http://p2.ttnews.xyz/loading.gif)
图书简介
风控领域是新兴的机器学习应用场景之一,其特点包括了负样本占比极少、业务对模型解释性要求偏高、业务模型多样、风控数据源丰富等。
《智能风控:原理、算法与工程实践》一书共 8 章,包含 26 种解决方案,分别介绍了自动化规则挖掘、集成模型评分卡、项目冷启动、幸存者偏差、不均衡学习、异常检测、模型优化、网络挖掘等方向所面临的问题,同时利用决策树、集成学习、迁移学习、无监督学习、半监督学习、模型融合、深度学习、图算法等机器学习模型对其进行改善,帮助读者更好、更快地解决实际的建模问题。本书由机械工业出版社于2019年12月出版。
梅子行,男,历任多家金融科技公司风控算法研究员、数据挖掘工程师等职位。现供职于智能物流独角兽公司——满帮科技。
师承Experian、Discover等风控专家。擅长深度学习、复杂网络、迁移学习、异常检测等非传统机器学习方法。热衷于数据挖掘以及算法的跨领域优化实践。
图书目录
前言
第 1 章 风控建模与规则挖掘 / 1
1.1 信贷与风险 / 1
1.1.1 信贷业务与互联网金融风控体系 / 1
1.1.2 信贷风险与控制 / 4
1.2 工业建模流程 / 5
1.2.1 抽象业务 / 6
1.2.2 定义标签 / 6
1.2.3 样本选取 / 7
1.2.4 特征工程与模型调优 / 7
1.2.5 上线监控与评估报表 / 8
1.3 规则挖掘方案 / 11
1.4 本章小结 / 18
第 2 章 集成模型评分卡 / 19
2.1 特征工程解析 / 19
2.1.1 特征与模型 / 20
2.1.2 信用模型的特征 / 20
2.2 特征衍生方案 / 22
2.3 离散处理 / 24
2.3.1 one-hot编码 / 25
2.3.2 WOE编码 / 26
2.4 迭代特征筛选方案 / 31
2.5 自动化调参 / 36
2.5.1 自动化调参策略 / 37
2.5.2 参数搜索方案 / 37
2.5.3 调参框架搭建 / 38
2.6 递归特征删除方案 / 41
2.7 评分卡制作 / 43
2.7.1 逻辑回归评分卡 / 43
2.7.2 集成模型的评分映射 / 53
2.8 本章小结 / 58
第 3 章 迁移学习与冷启动 / 59
3.1 迁移学习基础 / 59
3.1.1 应用场景 / 60
3.1.2 概念介绍 / 60
3.2 迁移学习方法论 / 61
3.2.1 三类常见算法 / 61
3.2.2 迁移的实现方法 / 62
3.3 少量有标签样本的迁移方案 / 63
3.3.1 TrAdaBoost模型 / 63
3.3.2 跨场景迁移模型 / 65
3.4 无标签样本迁移之 JDA / 74
3.4.1 JDA模型 / 74
3.4.2 模型应用 / 77
3.5 无标签样本迁移之 DTELM / 80
3.5.1 ELM模型 / 80
3.5.2 DTELM模型 / 81
3.5.3 模型应用 / 83
3.6 迁移样本筛选方案 / 88
3.6.1 背景介绍 / 88
3.6.2 算法框架概览 / 88
3.6.3 搭建融合框架 / 88
3.7 本章小结 / 93
第 4 章 幸存者偏差 / 94
4.1 幸存者偏差的含义 / 94
4.2 增量学习 / 95
4.3 生成对抗网络 / 96
4.3.1 GAN模型介绍 / 97
4.3.2 GAN与幸存者偏差 / 98
4.4 高斯聚类模型 / 99
4.4.1 GMM算法原理 / 99
4.4.2 GMM简单应用 / 102
4.4.3 GMM中的概率模型 / 102
4.4.4 GMM样本生成 / 106
4.5 信息准则 / 108
4.5.1 赤池信息准则 / 109
4.5.2 贝叶斯信息准则 / 109
4.5.3 AIC与BIC比较 / 110
4.6 本章小结 / 111
第 5 章 不均衡学习 / 112
5.1 样本不均衡 / 112
5.2 代价敏感加权方案 / 113
5.3 插值过采样方案 / 114
5.3.1 SMOTE算法 / 114
5.3.2 过采样算法实践 / 115
5.4 半监督学习方案 / 120
5.4.1 前提假设 / 121
5.4.2 S3VM / 121
5.4.3 LP / 125
5.5 本章小结 / 129
第 6 章 异常检测 / 130
6.1 离群点与欺诈检测 / 130
6.2 z-score检验 / 131
6.3 LOF异常检测法 / 132
6.3.1 原理与算法流程 / 132
6.3.2 LOF样本清洗方案 / 134
6.4 IF异常检测法 / 137
6.4.1 原理与算法流程 / 137
6.4.2 PreA模型与冷启动 / 139
6.5 本章小结 / 141
第 7 章 模型优化 / 142
7.1 多损失函数分段预测 / 142
7.1.1 2种损失函数 / 143
7.1.2 融合流程 / 143
7.2 树模型特征衍生 / 145
7.2.1 GBDT离散化 / 146
7.2.2 融合方案详解 / 146
7.2.3 特征衍生细节 / 147
7.2.4 案例 / 148
7.3 时间序列建模 / 156
7.3.1 RNN / 157
7.3.2 LSTM / 160
7.3.3 门控结构 / 161
7.3.4 LSTM行为评分卡案例 / 163
7.4 高维稀疏数据建模 / 167
7.4.1 算法原理 / 167
7.4.2 算法应用 / 169
7.5 模型融合 / 171
7.5.1 模型融合基础 / 171
7.5.2 模型筛选 / 172
7.6 本章小结 / 179
第 8 章 知识图谱 / 180
8.1 复杂网络基础 / 180
8.2 中心度与相似性 / 183
8.3 节点分类 / 189
8.3.1 朴素节点分类 / 189
8.3.2 邻节点加权投票 / 191
8.3.3 一致性标签传播 / 193
8.4 社区发现算法 / 196
8.4.1 基础概念 / 196
8.4.2 Girvan-Newman算法 / 197
8.4.3 Louvain算法 / 199
8.4.4 社区评估 / 200
8.5 网络表示学习 / 202
8.5.1 矩阵分解 / 203
8.5.2 节点嵌入 / 207
8.6 图卷积神经网络 / 211
8.6.1 卷积神经网络 / 211
8.6.2 傅里叶变换 / 213
8.6.3 拉普拉斯算子 / 215
8.6.4 GCN中的图卷积 / 217
8.6 本章小结 / 221
参考文献 / 222
閱讀更多 薦書少年 的文章