刘时斌:互联网金融风控模型

 
发布时间: 2016-2-12 22:41
知识文档-点击下载

金融分论坛-3刘时斌 P2P金融评分卡模型.pdf

2.2 MB, 179人喜欢 , 8092人浏览

所需积分: 5 积分 [立即下载]

完整版 PDF

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第000页.jpg
互联网金融风控模型 刘时斌
金融分论坛-3刘时斌 P2P金融评分卡模型PDF第001页.jpg
刘时斌
  • 数信互融研发负责人,联合创始人
  • 统计学硕士。法国INSA de Toulouse
  • 曾在SAS任职负责风险产品开发超过十年、拥有丰富的风险产品开发经验
  • 作为SAS中国和北京大学战略合作项目实施人、在北京大学连续三年主讲“统计分析和商务智能”课程



金融分论坛-3刘时斌 P2P金融评分卡模型PDF第002页.jpg

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第003页.jpg
风险类别-BASEL

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第004页.jpg
风险管理:零风险?

RAROC(Risk Adjusted Return on Capital)即风险调整资本收益 平衡收益和风险,即收益/风险,承担每单位风险的基础上收益的最大化.

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第005页.jpg
金融的本质: 风险定价

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第006页.jpg
r = 100% !!

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第007页.jpg

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第008页.jpg
IFRE模型

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第009页.jpg
业务模式的更新速度决定了模型的迭代周期

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第010页.jpg
算法:有监督的学习

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第011页.jpg
传统数据和大数据的拼接

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第012页.jpg
大数据对模型和风控的影响

  • 非结构化数据: 影音,图像,文本
  • 存储,传输,运算
  • 数据维度的增加,即第三方数据的接入
  • 行为数据
  • 传统结构化数据和非结构化数据的投入产出比:8/2 ?


金融分论坛-3刘时斌 P2P金融评分卡模型PDF第013页.jpg
大数据对模型和风控的影响

数据是不是越多越好?
- 有代表性(Representative)
- 数据中 所从呈现出的规律是否稳定(Stationary)

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第014页.jpg
最少需要多少数据?

如果有10个变量, 每个有2个属性值. 则需要2^10=1024 条数据才能覆盖所有属性的组合。

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第015页.jpg

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第016页.jpg
数据清洗

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第017页.jpg
数据准备:图像数据结构化

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第018页.jpg
数据准备:文本数据结构化

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第019页.jpg
数据准备:数据词典

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第020页.jpg
数据准备: 收集客观数据

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第021页.jpg
数据准备:数值类数据的收集

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第022页.jpg

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第023页.jpg
数据修复:补性别缺失值

目的: 按照real_name填充缺失性别
说明: 按照名字
Eg:先生、女士、易区分性别关键字
含有萍、玲等修复性别为女,含有磊、国等修复性别为男。

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第024页.jpg
数据探索: 个人申请-工资 salary

结论:工资 这个变量并没有对贷款是否成功有显著影响。

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第025页.jpg
数据探索: 企业主-年龄 age

结论:年龄 这个变量并没有对贷款是否成功有显著影

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第026页.jpg
数据探索: 婚姻 marriage

个人和企业主 婚姻 这个变量的缺失值都很高
结论:
个人的婚姻对成功与否帮助不大;
企业主已婚的成功率高

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第027页.jpg
数据探索: 衍生变量

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第028页.jpg
个人信贷评分卡

  • 算法:Fisher Linear Discriminant, 决策树,逻辑回归 Logistic Regression,神经网络
  • Logistic回归是研究因变量为二分类或多分类观察结果与影响因素(自变量)之间关系的一种多变量分析方法,属概率型非线性回归。
  • Ln(P/(1-P))= β0+β1X1+β2X2+... Odds=P/(1-P)


金融分论坛-3刘时斌 P2P金融评分卡模型PDF第029页.jpg
个人非业主模型ROCROC曲线 个人非业主模型分数分布图

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第030页.jpg
企业主模型ROCROC曲线 企业主模型分数分布图

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第031页.jpg
模型验证

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第032页.jpg
模型应用策略

金融分论坛-3刘时斌 P2P金融评分卡模型PDF第033页.jpg
模型应用策略

  • 产品定价:按照模型计算的通过率给申请信息定价
  • 流程简化:通过模型分类,降低审核人员的工作量
  • 精准营销:通过分析信贷员的准过率,同样类型的信息优先推荐给放款审核宽松的信贷员
  • 商业模式拓展:对通过率高的客户,可直接推荐给B端,放款收佣金
  • 上述策略的应用基础建立在模型精准的基础上,现有的模型需要新的数据迭代验证和迭代开发。




  • 世界级湾区“粤港澳大湾区”研究集合
  • 2019年4月,值得收藏的35份报告
邮件订阅
最新热门
 
相关知识
 

Copyright© 2005-2018 USEIT.COM.CN|帮助中心|关于我们|注册协议|投诉指引|获取积分|投稿须知|作者权益|下载须知|联系我们|手机版|USEIT Inc.

GMT+8, 2019-5-26 04:28 , Processed in 0.262844 second(s), 25 queries , Gzip On, MemCache On.

鄂公网安备 42011202000160号  鄂ICP备13013806号-1

网络经济主体信息湖北省互联网举报平台 中国互联网违法和不良信息举报中心

快速回复 返回顶部 返回列表