- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
银行客户满意度分析论文.doc
浙江大学宁波理工学院
银行服务客户满意度分析
综合评定成绩:
评委评语:
评委签名:
银行服务客户满意度分析
摘要:
随着全球银行业市场竞争的日趋激烈,提升客户的满意度,培养忠诚客户已成为各大商业银行开拓市场,增加盈利的重要手段之一。通过数据挖掘技术对客户满意度进行分析已成为研究热点。
桑坦德银行(Santander Bank)是欧洲第二大银行,他们提供了一个数据集要求通过数据挖掘技术在早期就能识别对其服务不满意的客户,以便及时采取合适的改进措施以提升客户的体验。
关键词: 数据挖掘技术 顾客满意度 PCA主成分分析法 决策树 预测
The thesis title
Abstract: A brief description of the abstract
Key words: The keyword extraction
目 录
1. 研究目标 6
2. 分析方法与过程 6
2.1. 总体流程 6
2.2. 具体步骤 6
2.3. 结果分析 7
3. 结论 7
4. 参考文献 7
挖掘目标
(1)背景:
随着全球银行业市场竞争的日趋激烈,提升客户的满意度,培养忠诚客户已成为各大商业银行开拓市场,增加盈利的重要手段之一。通过数据挖掘技术对客户满意度进行分析已成为研究热点。
桑坦德银行(Santander Bank)是欧洲第二大银行,他们提供了一个数据集要求通过数据挖掘技术在早期就能识别对其服务不满意的客户,以便及时采取合适的改进措施以提升客户的体验。在本次竞赛中,参赛者需要通过分析匿名用户的上百个特征来预测用户对其银行服务的满意程度(满意或不满意)。在数据集中ID表示客户的匿名ID,TARGET是需要预测的变量,1表示不满意,0表示满意,剩余的列是已提取的跟客户满意度相关的观测指标(属性);
需求:
分析哪些特征或特征组合能较好的对银行服务满意程度进行分析;
2、 建立合适的银行服务客户满意度模型;
3、 预测在测试集中每个客户的满意程度(属于不满意客户的概率);
4、 建立合适的评价指标,验证你的预测结果。
说明:
附件共分三个文件:Train.csv中是训练数据,其中包含预测量TARGET,Test.csv是测试数据,只包含属性数据。Sample_submission.csv是需要与源代码一起上传的最后结果样式,要求输出对Test.csv的测试结果。
(2)目标:
本次数据挖掘建模要达到的目标是利用银行关于客户信息建立下来的数据,采用数据挖掘技术,进行已知数据以及结果的相关分析测试找到规律建立模型,之后利用测试数据带入模型进行预测得到你结果。
题目给出的大数据的属性以及维度都比较大,所以会有一些冗余和无效数据,首先要先将高维大数据进行预处理,利用weka的元学习器,通过与NativeBayes方法一起使用,测试软件自带的属性选择方法,选择得到一些最具影响力的属性进行作为训练子集,并且运用进算法里面。这个方法可以将数据进行降维,保留相应比较主要的影响因素属性。随后将数据和人属性一起放入决策树分类算法,建立合理的模型,可以找到不同属性对目标决定影响程度,建立完成比较合理的分类系统。随后将题目给出的测试数据放入模型,利用已知的模型进行预测,可以推算出客户满意情况,银行可以对于这个预测结果对相应用户可以提早对其采取相应措施。
分析方法与过程
总体流程
2.1.1 问题1
2.1.2 问题2、3、4
具体步骤
2.2.1 解问题1
将excel数据进行转化得weka可以识别的csv格式,利用weka的另存功能得到arff格式,这个过程得到的数据还是不能直接进入决策树运用的。需要打开arff格式的数据,将数据类别的一栏修改为银行需要的0、1满意度类别,将数据加载计入决策树可以得到一个枝节繁茂的树,由此可以从这棵树的模型之中得到影响因素中最大的特征或特征组合为根节点以及靠近根节点的几个特征。
使用wake通过决策树J48算法 ,验证训练集,结果如图:
图1
图2
2.2.2 解问题2、3、4
本用例主要包括如下步骤:
步骤1:数据筛选数据预处理
从原始数据分析得到,题目给出的原始数据属性太多,并且都是未知属性,此外表格的大部门数据值为0,面对这个训练集,里面特征很多是和类标签有关的,但里面存在噪声或者冗余。在这种情况下,需要一种特征降维的方法来减少特征数,减少噪音和冗余,减少过度拟合的可能性。
所以我们利用weka深入研究自动属性选择,它允许指定
您可能关注的文档
最近下载
- 轨道交通基础设施巡检方案.docx VIP
- 创造学第五章——类比法详解.ppt
- 高中数学培优讲义练习(选择性必修二):专题4.13 等差数列和等比数列的综合应用大题专项训练(30道)(学生版).docx VIP
- 导游业务相关知识.ppt VIP
- 2025年宁夏职业技术学院单招职业适应性测试题库及参考答案.docx
- Unit 1 Animal friends复习课件-人教版七下英语2024.pptx VIP
- 反洗钱金融行动特别工作组“40+9”建议(简称FATF 40+9项建议).docx VIP
- 部编版四年级语文下册第9课《短诗三首》优质课件.pptx
- 融合训《壳班出身职业之路》考试题卷附有答案.docx
- MG动画《数字传媒学院MG动画宣传片》——动画制作全过程阐述.docx
文档评论(0)