- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1数据挖掘和知识获取数据挖掘是在数据库中进行知识发现的重要方法,是从大量的表面数据中提取隐藏在其中的知识的过程。 近年来,该技术发展迅速,已应用到各个领域。 本文主要介绍固话漏话用户数据挖掘和分析。 2数据挖掘技术应用于电信用户数据研究21固网用户数据的组成和结构对于企业来说,大量的用户数据不仅有利于客户关系管理,同时也是获得用户知识的源泉。 从用户知识发现的过程中可以看到,用户数据的质量会对知识发现的结果产生直接的影响,所以用户数据准备也是一项很重要的步骤。 从商业系统中提取出高质量的用户数据就成为一项最主要的工作。 固网企业的用户数据包括用户基本信息、用户账单信息以及客服信息。 数据仓库就是根据这种方式来组织的。 22知识发现的方法和过程用户知识发现概括如下根据提出的商业目标,分析大量的用户数据,找出隐藏的和未知的规律或者丰富已知的规律,进而提出模型;最后要将数据挖掘和分析的结果转化成有商业意义的方法,然后采取进一步的行动。 用户知识发现必须遵循以下几个步骤商业理解,数据理解,数据准备,分类模型,评估应用。 23数据挖掘建立用户分类模型近年来,以客户为中心的电信市场开始强调为不同用户提供个性化服务,其前提条件就是用户分类。 这也说明了过去的消费行为也预示了未来的消费倾向。 1商业理解对用户的理解不仅是理解电信市场的开始,也是理解客户关系管理的开始。 在电信企业中对用户的理解包括用户种类,不同类中用户的本质属性区别,用户偏好,不同类别之间的用户如何通信等。 2用户数据准备对用户分类的研究主要是从用户属性中得到用户特征和行为习惯。 主要数据来源于用户账单信息,同时也需要从商业系统中得到一些用户的基本属性信息。 3用户分类模型本文使用聚类分析对用户进行细分以建立分类模型。 聚类分析是把大量数据点的集合根据最大化类内相似性、最小化类间相似性的原则进行聚类或分组,使得每个类中的数据之间最大限度地相似、而不同类中的数据之间最大限度地不同。 3固网漏话用户数据分析31关于固网漏话用户数据分析的商业理解通过各种渠道调查,对固网漏话用户数据分析的目标可以概括为以下几点1对用户通话次数、时间段等分析,找出特征,以此来寻找目标用户;2对用户开通漏话保护业务前后的值分析比较,分析收益的对比;3对目标用户数据分析,从用户分类的角度来管理,设计针对性的服务,提升用户满意度。 32系统用户数据准备数据准备的过程明确目标;制定计划;分析变量的获取;数据收集和获取;数据集成。 根据当前客户关系管理基本状况和数据挖掘的目的,涉及到的人口属性变量有性别、年龄、住址、用户职业、婚否、学历、薪资等。 用户分类结束之后,再使用描述变量来进行分析说明。 本文选用某市电信公司运营支持系统和经营分析系统的数据,从中选取了基本客户基本信息表、客户详细话表、账单及缴费信息表、产品信息表、业务使用清单等原始数据。 数据挖掘工具选择。 在使用该工具进行挖掘之前,需要对数据进行清洗1删掉不满足要求的数据选择普通的用户;选择状态正常的用户;选择入网时间较长的用户,使数据有完整的用户周期;2去掉异常数据比如用于测试的号码;3去掉极端值不具备普遍性的极值容易产生噪声。 33固网漏话用户数据分析结果考虑到不同分类建立的有效性和简便性,以及固话用户和数据源的特点,本文采用常见的-算法,其高可靠性、高精准性以及低复杂度使其成为主流的聚类算法。 本文选用作为数据挖掘工具进行-聚类分析。 获取原始数据并进行预处理之后,选择参与聚类的细分变量,输入簇的个数,选择=7,然后点击聚类按钮,使用-算法对固网漏话用户数据进行聚类。 经过正常值选择、极值处理等一系列的数据清洗工作,最后用于研究的记录有251284条。 34分析结果和解释93的遇忙话务都出现在8∶00~18∶00的工作时段,这说明该时段遇忙话务较多,话务量流失严重,特别需要遇忙话务的解决方法。 而这一时间段遇忙话务量最多的就是政企用户,这些话务量流失对政企用户将造成巨大的损失30000政企用户一个月遇忙话务损失达到260万次,本网超过120万次,每个月预计损失20万;以电信中等发达省份为例符合条件的政企高端用户约为60万;每年度损失的潜在业务收入为50000万。 经过分析,得到该市各地区已开通和未开通漏话保护业务的用户分布,如图4所示。 区属于政务新区,未开通漏话业务的用户较多,而区属于工业园区,企业较多,很多用户已开通漏话保护业务,但是还有大量用户未开通该业务,所以区和区应该作为该业务的重点推广地区。 综上分析,固网漏话业务是一个非常有潜力的业
文档评论(0)