- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
金融智能-信用风险评分要点
信用风险评分方法 * 信用评分 国际上最有名的个人信用评分系统由FICO公司推出。FICO的评分系统得出的信用评分范围在300~850分之间,分值越高,个人的信用越高。 信用评分表有两个特点: 信用评分特别低和特别高的人数占比都较少,大多数信用评分中等,大体呈现左偏的正态分布。 信用评分分值越高,违约率越低。 因此,银行发放信用卡和贷款的时候,可以根据信用评分的高低进行注入是否发放、贷款额度、是否需要抵押等重要决策。 * 美国信用评分分布及违约情况 * 信用评分 信用评分定义:信用评分是使用统计模型的方法来对潜在客户和已有客户在贷款(包括信用卡)时的风险通过评分卡的方式进行评价的一种方法。 随着这种统计建模方法的成熟应用,其方法也被广泛应用到欺诈评分、市场响应评分等诸多领域。 * 信用评分表示例子 * 信用评分表示例子 * 信用评分例子 以一个简化的实际场景为例 - 是否审核通过个人小额贷款的申请。 如果选取信用评分的临界点为500分,即如果信用评分大于500分,则同意发放贷款,反之则拒绝发放贷款,根据这两个申请者,我们可以根据信用评分的方法得到两个决策结果。 * 根据信用评分判定是否发放信用卡示例 * 信用评分卡的优势 这种形式便于理解和应用 。决策树或者神经网络算法数据分析员可以理解和接受,但是广大业务人员却不甚了解。 监管机构容易对银行审核标准合规性进行有效监管。采用信用评分卡方式,监管机构很容易看到银行使用了哪些因素作为审核标准,从而判断这种标准是否合规。 信用评分卡很容易实施和监控。当市场环境变化时,也容易了解各个构成要素对信用评分的可能影响的大小和方向,并方便进行调整。 * 商业理解 问题一:(量化)将小额贷款风险问题转化为数据分析的问题? 小额贷款风险的问题可以理解为一个有目标变量的预测问题,目标变量为是否违约,即根据信贷账户的属性及表现来预测信贷账户是否有违约风险。根据业务经验来看,拖欠还贷按照拖欠其长短可以分为:拖欠少于30天,31天~60天,61天~90天,拖欠180天以上的基本可以认为是坏账。可以采取这样的定义来确定目标变量——信贷账户是否违约:表现期内未拖欠为好,3个月及以上拖欠为坏,1~2个月拖欠数据删除不用。 * 商业理解 问题二:(数据获取)如何获取数据? 信用评分从类别上看可以分为申请评分与行为评分。其中申请评分是指对贷款申请人的资信情况进行评估并预测其未来违约可能性的模型。行为评分是指对已经发放贷款的个人所表现出来的各种行为特征来预测其未来的贷款偿还表现的模型。 对申请评分来说,预测自变量的数据来源主要是信贷申请人在申请贷款时所提交的申请资料。预测目标变量的取值可以按照贷款人的实际拖欠行为进行判断。 * * * 商业理解 问题二:如何获取数据?(续) 对行为评分来说,除了可以获取贷款人在贷款申请时提交的各种信息外,还可以从系统中提取大量关于贷款人的资金使用、消费以及还款情况的数据。这些数据包括以下变量: 账户存在时间; 过去12个月最严重的拖欠行为; 过去12个月的平均贷款余额; 过去6个月现金提取额占交易额比例; 过去6个月平均消费(刷卡)额; 过去6个月消费(刷卡)类型 * 商业理解 问题三: (建模)建立一个模型还是多个模型? 一方面,针对同样的群体可以有多种产品。例如针对个人用户,银行可以提供信用卡产品,也可以提供包括住房贷款、小额贷款等多种信贷服务 另一方面,针对同样的产品,面向特征有显著差别的不同群体。应该建立多个模型。例如信用卡申请评分中,按照信用卡类型分为白金卡客户、金卡客户、普通客户等;按照所在城市消费能力不同可以分为经济发达地区、经济一般发达地区、经济欠发达地区等分别建立模型。 * 数据准备 * 信用评分法中的变量分箱 变量分箱不存在标准答案,通常遵循以下基本原则: 分箱数应当适中,不宜过多或过少。过少区分度不足,过多则稳定性不强且不方便管理; 各个分箱内的记录数合理,不应过多或过少; 结合目标变量,分箱应该能表现出明显的趋势特征; 相邻分箱的目标变量分布差异应该较大 * 好的分箱和不好的分箱 * WOE:证据权重(Weight of Evidence) * 年龄的分箱结果 * IV:信息值(Information Value) /100 * 生成信用评分模型 * 信用评分方程式 * 信用评分方程式 * 信用评分方程式 * 模型检验 K-S指标法检验预测模型 评分为500分时,两条曲线距离最大,其中坏客户累计占比达到了82%,好客户为33%。如果把500分作为拒绝贷款的临界点,则会拒绝82%的坏客户,舍弃了33%的好客户,在500分处K-S值为0.49.一般区分度在30%以上的模型是可以接受的。 SPSS Inc. Copyri
文档评论(0)