- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
金融数据挖掘与商业数据挖掘 建构信用卡评分模型之商业智能流程
金融数据挖掘和商业数据挖掘 建构信用卡评分模型之商业智能流程 郑宇庭 谢邦昌 程兆庆 台湾政治大学资料采矿中心 报告大纲 研究目的 分析工具 建模流程 结论与建议 QA 研究目的 有效地筛选出偿债能力不佳的个人信用卡客户,依此开发出一套信用风险系统,以帮助银行做出正确的核卡决策。 这个系统的开发、维护、与更新的成本预期将比银行现有系统的成本低。 分析工具 Microsoft SQL Sever 2005 价格 自动化以及开发延伸程度 目前SPSS跟微软之间是采取合作的态度 建模流程:CRISP-DM 微软商业智慧解决方案 资料采矿无处不在 商业理解(Business Understanding) 厘清商业问题 目前呆帐率是多少? 信用卡审核流程? 信用卡评分模型=分类模型 资料理解(Data Understanding) 资料来源 某银行2000.1.1~2002.6.30的信用卡资料 数据内容 申请数据文件 缴款纪录文件 总共有1220个变数,502,333笔原始资料 违约户定义 缴款期间曾经有逾期60天以上未缴之卡户 建模流程图 资料准备(Data Preparation) 选择合理的建模变量 基本数据 性别、教育程度、职业别…… 联合征信中心(JCIC)的资料 被查询总家数、延迟月数比率…… 与银行往来的资料 申请卡别类型、有没有使用扣款服务…… 资料准备(Data Preparation) 选择合理的建模时间 时间间隔取为12个月至18个月 清除遗漏值、异常值 数据转换 连续型转成离散型:被查询总家数… 合并变项太多之变量:职业别… 衍生新的变数 建模(Modeling) 误差抽样(Over-Sampling) 将稀有事件透过抽样的方式将其比重提高 多的少抽(Reduce):正常户抽取率0.1 违约户抽取率1 将资料分成训练组与测试组 避免过度学习(Over-fitting) 建模方法选择 罗吉斯回归、决策树、类神经网络 Data Mining Model Evaluation Data Mining Model Evaluation 分类矩阵 横轴为预测结果,纵轴为实际结果 增益图 横轴为名单百分比,纵轴为累积占全体之百分比 收益图 根据成本以及销售成功利润,并计算出累积利润图 散布图 针对连续变量,可以利用此功能了解实际值与预测值间之差异性以及预测之趋势变动情形 Data Mining Model Evaluation Data Mining Model Evaluation Data Mining Model Evaluation Data Mining Model Evaluation Data Mining Model Evaluation 评估(Evaluation) 增益图(lift chart) 评估(Evaluation) 分类矩阵(classification matrix) 衡量指标 Precise = a/a+b Recall = a/a+c Accuracy = a+d/a+b+c+d 发布(Deployment) 产生预测的违约机率值 单一查询 整批查询 结论与建议 本研究以罗吉斯回归模型预测能力最好 本研究目的在于帮助作核卡的决策,另外有一些主题可供继续研究 核卡后 针对缴费情况的变化,再建构一预测违约模型,以预防违约发生。 已违约 建立一处理催收顺序的模型 QA 欢迎提出问题讨论 谢谢大家! * * * 图表来源:杨自强 企业如何应用商业智慧来提升执行力与竞争力 DATA MINING 执行阶段 商业理解 资料理解 资料准备 建模 评估 发布 资料源 DATA MINING 处理流程 图表来源:杨自强 企业如何应用商业智慧来提升执行力与竞争力 SSIS 分析服务 报表服务 分析服务 (Data Mining) 资料来源检视表(Data Source View) 整合性 服务 (SSIS) 商业理解 资料理解 资料准备 建模 评估 发布 资料源 资料源 群集 时序群集 找出潜在相似性,例如市场区隔、侦测晶圆瑕疵分配、文件分类、保险浮滥理赔侦测、伪卡侦测 关联规则 决策树 找出产品交叉销售关联性,又称为购物篮分析 时序群集 预测序列,例如找出网站使用者的点选路径模式、客户缴款行为模式、商品购物顺序 回归树 时间序列 类神经网络 预测连续变量,例如预测销售量、预测客户价值变动、预测金融商品价格波动... 决策树 贝氏机率分类 群集 类神经网络 罗吉斯回归 预测类别变量,例如营销响应、顾客流失、违约预测(巴塞尔资本协定IRB)… Microsoft 算法 商业问题
您可能关注的文档
- 酒店网络营销与电子商务 - 中国旅游交易网.ppt
- 酸性体质与P2H的问题解答.doc
- 酸与碱_复习课.ppt
- 酒店IBMS模式与平台介绍--同程酒店项目介绍.ppt
- 酒店经营与市场计划之可行性方案.doc
- 酸的与甜的教学设计.doc
- 酸的与甜的.ppt
- 酸的与甜的099.ppt
- 酸性水汽提与硫磺回收联合装置操作规程.doc
- 酸的与甜的课件.ppt
- 安全生产考核奖惩制度3篇.doc
- 颅脑损伤病人的护理查房【优质公开课】精品PPT课件模板.pptx
- 二零二二年度德州继续教育公需科目《公共事务管理与服务能力》试题及答案.pdf
- 二零二二年度党风廉政建设知识竞赛题库(含答案).pdf
- 二零二二年度度枣庄市专业技术人员继续教育公需科目培训班互动题.pdf
- 二零二二年度儿童保健学试题库(含答案).pdf
- 二零二二年度第十九届中国东南地区数学奥林匹克竞赛高一试题(含答案).pdf
- 二零二二年度动物卫生监督题库(含答案).pdf
- 黑龙江省大庆市重点中学2023-2025学年高一下学期2月开学考试英语试题(含解析).docx
- 二零二二年度法检书记员招考《公基》测试题库(含答案).pdf
文档评论(0)