- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘与电信行业客户关系管理 主讲:严宇飞 一.数据挖掘与电信行业 国内电信市场的不断壮大和繁荣,人们对通讯产品的认知水平和消费能力不断提高,虽然给各家电信企业提供了前所未有的发展空间和机会,但也使得各家电信企业都不得不直接面对一些问题. 什么是数据挖掘? 数据挖掘(Data Mining),也叫知识发现、数据开采等,是指是从大量数据中,提取正确的、新颖的、潜在有用的并能够被理解的知识的过程。数据挖掘能进行分类预测、聚类分析、关联规则和序列模式的发现、相关分析、异常监测和趋势分析。 电信行业客户数据的特点 作为信息化方面一直处于领先地位的电信业,一方面在长期的经营中积累了海量的客户数据,同时业务经营迫切需要从浩如烟海的数据中获得更多的、更有价值的客户特征信息。因此,数据挖掘在电信行业得到了广泛重视和大力发展。 因此适合数据挖掘技术的应用 国外知名的电信运营企业都已经建立了基于数据挖掘的商业智能系统:如英国电信采用数据挖掘手段,建立模型来确定潜在客户的购买倾向和他们变为客户之后可能的价值;法国电信利用数据挖掘技术在预防欺诈、客户流失分析和预测、交叉销售等各方面都取得很多成果;沃达丰利用数据挖掘技术建立模型研究客户离网的原因,并从不同的角度来进行市场细分。 国内电信业前几年的发展目标主要是抢占市场,技术领域主要是业务运营支撑系统BOSS的更新换代,但是近年来,山西电信、杭州电信、云南电信等电信企业也意识到挖掘历史数据对于降低坏帐损失,识别和防范恶意欠费行为的重要性,已经着手建立对自己所掌握的客户信息进行挖掘的智能化信息平台。 电信行业中的数据挖掘主题 客户细分 客户流失预测 客户欺诈识别 客户价值分析 交叉销售 事件营销 新产品、业务潜在客户预测 数据挖掘贯穿于整个客户生命周期 下面我们将对以下几方面着重介绍 基于数据挖掘的电信客户细分 基于数据挖掘的电信客户流失预测 二.基于数据挖掘的电信客户细分 电信CRM的数据体系结构 右图为结合了通信行业的行业特征以及数据挖掘技术的特点提的一套基于数据挖掘的电信CRM的体系结构。在这套体系结构中我们还可以清晰地看到一条价值增值链, 数据→知识→利润, 可以说这正是数据挖掘技术和客户关系管理地结合。 1.基于数据挖掘的客户细分过程 采用客户价值矩阵进行客户细分是一种有效而又易于实现的方法, 本次设计中结合了聚类和决策数算法进行了客户细分, 具体的分析过程右图所示。 2.聚类分析 什么是聚类分析? 聚类分析如同通常所说的“物以类聚”, 是把一组个体按照相似性归成若干类别。根据电信客户聚类分析的应用实际, 分为以下几个步骤: 确定细分主题、数据准备、选择聚类模型及聚类结果发布。 2.聚类分析 2.1 确定细分主题 本次设计中定义的目标是基于客户行为的客户细分, 行为特征是主要特征, 自然属性是辅助的特征。即需提取与客户基本信息、客户行为信息有关的数据。 2.2 数据理解 行为特征主要包括呼叫行为特征与业务行为特征, 这些数据都是CDR( 话单) 数据, 具有较高的可靠性。 2.3 数据准备 数据大致可分为两类:原始数据( 可以直接从客户信息表提取, 例如: 性别、年龄等) 和统计数据。 2.4 数据预处理 由于电信行业的数据量极大, 设计中采用抽样的方法分别为对缺失值和对异常值的处理, 例如: 客户属性数据为空的客户; 剔除存在消费额为负值的客户。 2.5 建模 在原有的k- means 算法中, 我们注意到两个问题: ( 1) 在k- means算法中初始聚类中心的选择都是任意选择, 这样会导致聚类结果的不稳定。( 2) 一次迭代内把每一个数据对象分到离它最近的聚类中心所在类, 这个过程的时间复杂度为O(nkd)。在数据量比较大时算法的时间开销也很大。针对以上的两个问题, 设计中采用了以下的改进k- means 聚类分析方法: ( 1) 选取K 个初始聚类中心:对数据集S 进行J 次有哪些信誉好的足球投注网站K 个近似聚类中心。Search( S, K, J) 输入数据取样次数J、数据集S、类别数目K; 输出K 个初始聚类中心 ( 2) 减少迭代次数:借用三角形三边不等定律的思想, 即三角形两边之和大于第三边的定律, 减少每次迭代的计算次数, 从而简化计算比较过程。 2.聚类分析 2.6 试验结果 1.选取K 值为10 的10000 个样本点 选取某电信公司的2006 年客户缴费数据, 选取10000 个样本, 经过数据清理后, 产生8725 条客户记录。对这些客户在1~3 月份的账单金额进行分析, 利用改进的K- means 算法细分成lO 个客户群见下表: 2.聚类分析 从这个结果中可以看到: 第1 类客户和第9 类客户长途话费占比较高。第5、第6 类客户的长途费远远高于市活费。第7
您可能关注的文档
- 關務知識講座.ppt
- 首钢莫托曼机器人培训学习报告_郭超。20110426.ppt
- 第三节 观光园艺的经营类型.ppt
- 中国合成橡胶分析报告.ppt
- 潜在失效模式及效果分析.ppt
- 数据流程教学课件.ppt
- 自考Java_语言程序设计(一)考情分析(即应试指导.ppt
- 磁软化水研究.ppt
- 复变函数(西交大)第八讲.ppt
- ch12房地产经济的宏观调控.ppt
- 4.1 陆地水体及其关系 课件高二上学期地理中图版(2019)选择性必修一.pptx
- 混凝土结构与砌体结构设计习题集 .pdf
- 统编版语文四年级下册 22.古诗三首 课件(共50张PPT).pptx
- 青海2024行测笔试真题及答案 .pdf
- 2.1 充分发挥市场在资源配置中的决定性作用 课件-高中政治统编版必修二经济与社会.pptx
- 27.巨人的花园 课件(共58张PPT).pptx
- 统编版语文一年级下册5 树和喜鹊 第1课时 课件(共37张PPT).pptx
- 2.1 充分发挥市场在资源配置中的决定性作用 课件政治一轮复习统编版必修二经济与社会.pptx
- 贵港市平南县2024届小升初考试语文试卷含答案 .pdf
- 小学期末考试质量分析 .pdf
最近下载
- 2025年高考地理二轮复习非选择题强化训练(课件).pptx VIP
- (二模)2025年广州市普通高中毕业班综合测试(二)数学试卷(含答案详解).pdf
- 14J938 抗爆、泄爆图集标准.docx VIP
- 降低CRRT治疗非计划下机率.pptx VIP
- 《中国心力衰竭诊断和治疗指南2024》解读(下).pptx
- 《预检分诊》课件.pptx VIP
- 2024年河南省政务服务办事员职业技能竞赛考试题库-下(判断、简答题汇总).docx
- 2025年部编版语文六年级毕业复习知识点.pdf VIP
- 2025年政务服务办事员技能大赛理论考试题库600题(含答案).docx
- 14J938抗爆泄爆图集标准.docx VIP
文档评论(0)