- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于随机森林的个人信用评估模型研究及实证分析
口 萧超武- 蔡文学- 黄晓字1 陈 康2
(1.华 南理 工 大 学 经济 与 贸易学 院 ,广 东 广 州 510006;
2.中国电信股 份有 限公 司 广 东研 究 院 ,广 东 广 州 510630)
[摘要]信用评估是商业银行控制和防范信贷风险的关键途径,针对当前个人信用评估模型多使用单一分类器,容易导
致过拟合且预测精度有限的问题 ,提出了基于随机森林组合分类算法的个人信用评估模型,并在实证分析中与KNN、
RBF—NET、SVM等单分类器模型以及组台模型GBDT~L较,发现基于随机森林组合分类器模型,在个人信用评估的应用
中,具有更高的预测精度和稳定性。通过对特征变量评价发现,贷款者个人信息中现有账户状态(透支或有余额等情
况)、信贷期限、信贷历史记录、贷款金额对信用风险预测准确率有显著的影响。
[关键字]个人信用评估;随机森林 ;特征变量评价
[中图分类号]F832.332 [文献标识码】A [文章编号]1003—1154(2014)06-0111-03
我 国商业 银 行个 人 信 贷业 务 飞速 发展 ,各类 信 机特征变量个数m,通 常设m 、/ ,二是决策树 的
贷 产 品层 出不 穷 ,然而 我 国个 人征 信 系统 尚未完 备 、 数 量k,通常 设为 比较大 的数值 。另 外 ,决策树 的分 支
信 用 环境 及 相 应 的法律 法 规不 完 善 ,个人 信 贷业 务 测 度 有3种选 择 :信 息熵 、Gini系数 和 “二 分 法 ”,由于
扩 展 的 同时 ,也 给银行 带来 了巨大风 险 。如何在 扩大 银 行个 人 信用 数 据在 分类 树 中为 非 均匀 分布 ,这里
业 务 规模 的 同时 ,有效控 制和 防范信 贷风 险 ,是 各大 选 择 杂质 函数 基尼 系数 (Gini)作 为分枝 标 准 ,其 定义
商 业 银 行 亟待解 决 的 问题 ,其 中重 要 的途 径 是 进行 如 下 :假 设集 合 咆 含Ⅳ个类 别 的记 录 ,那 么其G 指
个 人 信用 评 级 。解 决个 人 信用 评 级 问题最 常用 的手 标 为 :
段 ,是根 据 过去信 贷记 录 中个 人提 供 的信 息 ,以及是 2
,v
否违 约 的标 记 ,建 立信 用 评级 模 型 。纵 观 目前 的研 Gini(T)=1一∑
=,
究 ,评 估方法 多数 采用 单一 分类 器 。为 了克服单 个模
P )为类 另 在 节点 t处 的相 对 频率 ,当Gini(t)=
型 的过 度 拟 合 问题 ,Breiman…于2001年 提 出 了随机
ON ,即在 此节 点 处 的所 有记 录 均属 于 同一类 别 。如
森 林 (Random Forest,RF)方 法 。随机 森林 迅速 发 展 ,
果 集合 的条件 下分 成两 部分Ⅳ,和 ,那 么 这个
然 而 结合 随机森 林 的个人 信用 评估研 究较 少 。因此 ,
分 割 的Gn指 数就 是 :
研 究如何 引入 随机 森林 组 合分 类 器模 型 ,提 升 对用
N N 、
户
文档评论(0)