数据挖掘在电信业的应用.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

□序言□用户流失挖掘的主要方法□用户流失挖掘中应注意的问题■用户流失挖掘过程□建议与结论用户流失的数据挖掘用户流失类型28%的用户是重入网或反复入网引起的;流失用户的91.6%是在半年内流失(低网龄用户)。(一)重入网、反复入网用户挖掘NN+1N-6N-4N-5N-2N-3N-1新入网激活月新入网激活后第1月新入网激活月前半年的存量用户历史IMEI库或身份证库N月在网用户,区分新增和存量用户判断重入网用户判断新入网用户的有效IMEI或身份证号码N月新入网用户中的重入网和反复重入网用户名单剔除无效IMEI或身份证号码生成、维护历史有效IMEI库或身份证号库识别规则:通过对新入网用户使用手机的IMEI号(或身份证号码)与存量用户的IMEI号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户。(一)重入网、反复入网用户挖掘重入网新用户IMEI或身份证号与历史IMEI或身份证号码能够匹配(6个月以内)。反复重入网重入网用户在6个月以内重入网2次及2次以上的用户。识别过程为了提高分析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如下:用户在N月入网并激活(有话单产生),则在N+1月(计算月)对N月入网并激活的所有用户进行重入网分析。(一)重入网、反复入网用户产品/价格促销/宣传不同品牌及资费存在内部竞争,没有考虑体系间的平衡问题;预存费用低,用户入网门槛不高,使其可以轻易弃卡。新入网促销活动优惠力度过大;品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足。追求经济收益,受入网优惠的吸引;换取吉祥号码;欠费停机后选择重入网。竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网内部原因外部原因用户原因渠道/服务渠道迫于指标压力或利益驱动,自身养卡或诱导用户换卡;补卡成本高且手续复杂。(二)低网龄用户挖掘为了保证数据的完整性和可用性1、数据准备数据提取数据清洗数据审核数据集成数据仓库构建缺失数据处理极值数据处理错误数据处理冗余数据处理数据统计错误审核数据源错误审核数据统计口径审核提取建模所需数据(二)低网龄用户挖掘流失用户在网时长分析2、初步分析流失用户的91.6%是在入网后的六个月内流失流失用户的76%是在入网后的四个月内流失分别有22.1%和22.8%的流失用户在入网后的第一个月和第二月内流失数据来源:12年1月-10月新增用户流失用户定义:当月停机,且连续停机60天以上用户,到2012年11月仍未开机用户网龄举例:3月入网,3月流失的用户,网龄为0个月流失用户的在网时长分布(二)低网龄用户挖掘针对网龄1个月和2~4个月两个用户群分析3、进一步分析选择初始化更新结束计算包含每对样本间距离(欧氏距离)的距离矩阵,把每个样本作为一个簇使用距离矩阵查找最相似的两个簇将两个簇合并为一个簇,簇的个数通过合并被更新;同时更新距离矩阵当所有样本都合并成一个簇或满足指定的簇的数目时,整个过程结束1234执行n-1次步骤2和步骤3采用凝聚的方法(二)低网龄用户挖掘网龄1个月的流失用户-通话业务挖掘网龄1月新增用户细分模型(二)低网龄用户挖掘网龄1月新增用户细分模型网龄1个月的流失用户-数据业务挖掘(二)低网龄用户挖掘4、网龄1个月的流失用户数据挖掘序号细分群名称细分群特征规模占比1漫游突出用户群语音消费行为是用户主要行为属性;入网当月ARPU为100元/户左右,经常去外地,漫游话务突出,本地及长途话务很少,且漫游通话频次最高3.0%2长途话务突出群语音消费行为是用户主要行为属性;入网当月ARPU为100元/户左右,交往圈中有大量外地号码,长途话务突出,基本无漫游,且长途通话频次最高4.5%3本地话务突出群语音消费行为是用户主要行为属性;入网当月ARPU为75元/户左右,交往圈主要集中在本地,本地话务突出,基本无漫游,长途很少,且本地通话频次最高7.7%4本地话务偏好群语音消费行为是用户主要行为属性;入网当月ARPU为55元/户左右,交往圈主要集中在本地,通话时长相对较低,但本地话务相对突出,基本无漫游,长途很少12.6%5本地低端用户群语音和数据业务消费均较低,且二者消费相对均衡;入网当月ARPU为25元/户左右,主要在本地活动,本、长、漫通话时长均为最低,基本无数据业务使用量36.7%**数据挖掘技术在电信用户分析与保持中的应用

您可能关注的文档

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档