- 1、本文档共68页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
摘要
计算机、通信技术的飞速发展,加速了互联网和通讯网的融合,由此带来
的是在线社交网络日益成为人们沟通交流、交友等的重要平台,人们对于通信
服务的需求也迅速攀升,这给电信行业带来了一系列的机遇。同时又由于市场
的饱和、行业服务趋于同质化等因素的影响加剧了电信企业之间的竞争,客户
更是成为了稀缺资源,增加新客户变得愈加困难,所以如何稳定住现有的客户
不流仍然是各大电信企业关注的焦点问题。而且增加新的客户所花费的成本高
于保留老客户的成本,老客户的流失会给企业带来许多损失,所以研究预测客
户的流失模型是有必要且有意义的。国内外的专家学者也已经对此进行了大量
的研究并取得了许多有价值、可供参考的成果。同时,数据挖掘技术的发展为
企业探究预测客户流失模型提供了大量的理论方法支持。本文先对数据挖掘这
一领域做了概述,了解了相关的概念、流程和应用功能。鉴于电信客户流失问
题本质上是一个二分类问题,所以将应用数据挖掘中的分类方法来解决,在众
多分类方法中,选择了运用机器学习方法来解决。因此,在第三章对第四章进
行实证分析时所用到的机器学习理论逐一做了介绍,包括先研究了建模前进行
数据准备的数据预处理方法,接下来着重探讨和总结归纳了机器学习中的单一
模型包括k-近邻模型、朴素贝叶斯模型、CART 决策树模型、Logistic 回归模
型以及集成学习模型包括Adaboost 模型、梯度提升树模型和随机森林模型主要
在解决二分类问题时背后的数学、统计学等原理,总结归纳了上述算法的实现
步骤以及在实践应用中的优缺点等。
在理解了理论方法的适用范围及其优缺点后,在真实的数据集上进行实证
研究。在建立模型前,先具体了解了数据的基本信息包括统计信息、缺失率等,
然后在此基础上进行了数据预处理,包括部分特征变量的删除、缺失值的填充,
分类型变量的哑编码等,最终通过梯度提升树算法选择出了对模型预测结果影
响最重要的21个特征变量,作为模型的最终输入。将数据集划分为训练集和测
试集后,通过训练集对上述各个单一学习模型和集成学习模型进行训练。用
AUC值来作为模型性能的评估指标,并以此为根据对模型做出初步选择,同时
I
摘要
对比各个模型性能的优劣,发现单一模型的AUC值均低于集成学习模型的AUC
值,集成学习模型当中梯度提升树模型的表现最好,因此将梯度提升树作为最
终的预测模型。结合带交叉验证的网格有哪些信誉好的足球投注网站法和交叉验证法通过调参来优化模
型,最终获得了表现较优的模型。最后文章在结尾处对全文做了总结与展望。
关键词 电信客户流失;数据挖掘;机器学习;梯度提升树;AUC
II
目录
目录
摘要················································································· I
Abstract········································································ III
第1章 绪论·······································································1
1.1 研究背景及意义·······································································1
1.1.1研究背景····························································································1
1.1.2研究意义····························································································2
1.2 国内外研究成果
您可能关注的文档
- 地方政府行为对地方政府债券发行定价的影响研究.pdf
- CJ烟草公司现代零售终端建设优化研究.pdf
- 供应链模式下GGQ公司采购管理优化研究.pdf
- 保山市城市基础设施建设的政府投融资研究.pdf
- 变电站优质工程预评价模型构建及应用研究.pdf
- 减税降费政策落实跟踪审计研究——以A省为例.pdf
- “共建共治共享”视阈下社区养老服务路径研究——以X社区为例.pdf
- D县财政局事业编制人员激励优化研究.pdf
- 土地财政、城镇化与房地产发展——基于地方政府行为视角的实证研究.pdf
- 企业职工延迟退休意愿及其影响因素研究——基于charls2015数据的实证分析.pdf
- 10《那一年,面包飘香》教案.docx
- 13 花钟 教学设计-2023-2024学年三年级下册语文统编版.docx
- 2024-2025学年中职学校心理健康教育与霸凌预防的设计.docx
- 2024-2025学年中职生反思与行动的反霸凌教学设计.docx
- 2023-2024学年人教版小学数学一年级上册5.docx
- 4.1.1 线段、射线、直线 教学设计 2024-2025学年北师大版七年级数学上册.docx
- 川教版(2024)三年级上册 2.2在线导航选路线 教案.docx
- Unit 8 Dolls (教学设计)-2024-2025学年译林版(三起)英语四年级上册.docx
- 高一上学期体育与健康人教版 “贪吃蛇”耐久跑 教案.docx
- 第1课时 亿以内数的认识(教学设计)-2024-2025学年四年级上册数学人教版.docx
文档评论(0)