- 1、本文档共23页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2010-6-12
信用卡分析试验报告
信用卡用户数据分析实验报告
目录
TOC \o 1-3 \h \z \u 信用卡用户数据分析实验报告 2
目录 2
实验目的: 2
实验内容: 2
信用卡分析: 3
K-means分析: 4
Kohomen分析: 7
异常分析: 12
关联分析: 15
散点图分析: 16
集合分析: 18
多重散点图分析: 20
直方图分析: 21
实验目的:
1、熟悉Clementine软件从数据导入到结果输出的全过程。
2、复习Clementine 软件中聚类方法。
3、复习Clementine 软件中的关联分析方法
实验内容:
在Clementine 中建立信用卡数据分析模型;
聚类分析:使用K-Means、Kohonen、两步法,进行聚类,并简单给出结论;
异常点分析:使用“异常”节点进行异常分析,并简单给出结论;
关联规则分析:对其中感兴趣的字段进行关联分析,画出网络图,并简单给出结论。
信用卡分析:
打开操作区,选择“可变文件”,将之拖入操作区,编辑“可变文件”
,打开位于E盘中的“信用卡交易-Data.csv”数据源,如图所示:
在“类型”中将各个字段的值读入,如图所示:
然后进行各项分析。
K-means分析:
创建K-means结点,编辑使用定制设置,选择所要进行分析的字段名,如图:
选择“执行”,执行之后在右侧区域形成K-means模型,如图:
将K-means模型拖入操作区并与数据源相连:
单击模型进行分析:
点击“查看器”:
分析结果:
在对各项的字段进行分析中,对强制停卡记录、性别、都市化程度分成三个聚类,得出的结果是强制停卡记录、以及都市化程度的重要性均大于0.95,而性别的重要性则为0.00,说明强制停卡记录以及都市化程度对聚类的影响程度很大,而性别的影响程度几乎为0。
Kohomen分析:
创建Kohomen分析结点,选择相应的要分析的字段:
编辑完毕之后点击“执行”:
点击模型查看分析结果:
在查看器的分析结果中,三个字段的重要性均大于0.95,这说明个人月收入、婚姻、瑕疵户、三项因素对聚类的影响程度都很大。
两步聚类分析:
创建“两步”聚类分析结点,并进行编辑:
点击“执行”生成两步聚类分析模型,如图:
点击查看分析结果:
在分析结果中发现,学历、宗教信仰、月刷卡额字段的重要程度均大于0.95,说明这些因素对于聚类的影响程度都很高。
异常分析:
创建“异常分析”结点并与源文件相连;
在编辑结点中,选择所要分析的字段,如图所示:
点击“执行”后,形成异常分析的模型,然后点击查看:
为了更好的查看异常用户的异常情况,创建一张表,用来显示异常用户的基本信息。然后对表进行排序,将正常用户与异常用户隔离开来。如图所示:
分析结果如图所示:
在字段“O-Anomaly”中,若字段值为“F”,则为正常用户,若字段值为“T”,则为异常用户,如编号为14号的用户,即为信用卡异常的用户。
关联分析:
散点图分析:
在散点图结点中,要分析“都市化成都”以及“个人月收入”这两者之间的相关程度,故选择X字段以及Y字段分别为“都市化成都”和“个人月收入”。如图:
点击“执行”,结果如下图所示:
分析:
由上如的分析结果可以看出,生活在“都市”的居民人数最多,而收入高的人群也比生活在“都”以及“城”的居民多。其次是生活在“都”的居民个人月收入次之,最后是生活在“城”的居民。
集合分析:
利用集合分析来研究月刷卡额与年龄之间的关系,如图:
分析:
月刷卡额最多的群体是20——24的年轻群体;
其次是15——19和25——29岁之间的群体;
30——34岁之间的群体月刷卡额也在6000以上;
35——39岁之间的群体月刷卡额接近6000;
随着年龄的增长,月刷卡额也在下降。
多重散点图分析:
分析:
由图可以看出:对于个人月收入,各个学历的阶层都分布在10000元以下及60000元以上各个层次;
对于个人月开销,各个学历阶层都分布在10000元以下及40000元以上这些层次上。
直方图分析:
利用直方图分析年龄与信用卡使用量的关系:
分析:
持卡量最多的群体是20——24的年轻群体;
其次是15——19和25——29岁之间的群体;
30——34岁之间以及35——39岁之间的群体持卡量也很大;
40岁以上的群体持卡量较年轻群体较少;
您可能关注的文档
- 天津、北京、河北三地各大花鸟鱼虫市场全攻略.doc
- 天猫超市入驻资质细则.docx
- 天眼报告:P开年遇冷,成交额大幅下降.docx
- 田径运动会远度项目成绩记录表.doc
- 甜菊糖调查报告26日.doc
- 通过秘籍中级会计2017.doc
- 铜峰电子财务分析报告2005~2009.doc
- 童装电商运营方案.doc
- 投标文件格式会计师事务所.doc
- 图解析2015中国不良资产市场.docx
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
最近下载
- 市政道路开口施工方案样本.pdf
- 2024年社区工作者考试必背1000题题库附参考答案【模拟题】.docx VIP
- 教师竞选高级职称评选述职报告PPT.pptx VIP
- 海康磁盘阵列产品操作及说明书.pdf
- 安徽林海园林绿化股份有限公司招聘简章.doc
- 2024年小学一年级上学期语文期中考试试卷附答案(实用) .pdf VIP
- 2024年春江苏开放大学网络学习工具及应用第二次形考作业答案.docx
- 华东师大版八年级数学下册导学案.pdf
- 九年级英语Unit 4 I used to be afraid of the dark优秀教案.doc
- 深入探讨小学思政课课程改革创新txt.docx VIP
文档评论(0)