Chapter17电信业客户流失分析.pptx

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chapter17电信业客户流失分析

电信业客户流失分析;案例背景 商业理解 数据理解和数据准备 建立模型与模型评估 模型的应用及营销预演 ;客户——尤其是有钱有需求的客户是有限的 如何在客户即将流失之前发现他们,并对其特征进行刻画,从而挽留他们 多看看模型的构建、解读、验证和应用,不要过多纠缠于数据字段是否全面 决策树、神经网络、聚类模型;问题1:哪些客户可能会流失? 问题2:可能流失客户的特征是什么? 问题3:市场挽留活动的预计收益是多少?;不流失 自愿流失:销号 非自愿流失:欠费;客户基本信息 客户行为数据 客户交互数据 客户态度数据;自变量:1-7月 预测变量:8-10月;预期收益 =流失客户预期收入 -流失客户挽留预期成本;1、数据基础 客户基本信息表(编号,性别,年龄,在网时长,话费方案,手机型号) 客户通话情况表(编号,高峰时电话数,高峰时电话时长,低谷时电话数,低谷时电话时长,周末时电话数,周末时电话时长,国际电话数,国际电话时长,月份);话费方案表(话费类型,固定费用,免费时长,高峰时期单价,非高峰时期单价,周末单价,国际长途单价) 客户是否流失标记表(客户编号,是否流失);(1)单变量的变换 (2)衍生变量 (3)趋势类变量 (4)波动类变量;连续?连续: 便于计量和比较:如单位归一 修正数据的分布:如倒数、对数 标准化:如(原值-平均值)/标准差、 (原值-最小值)/( 最大值-最小值) 连续?离散:分箱(等距离、等数量、平均值加减三个标准差) 离散?连续:Likert量表 离散?离散:a,b,c?0,1;横截面数据(某一时点) 强度相对指标:如通话时长/通话次数 比例相对指标:如高峰时通话时间/总时间 时间序列数据(时间排序) 滞后类指标:如与去年同月相比、股价5日平均 汇总类指标:6个月的数据?一份数据;趋势值=; 波动值=;单个变量: 离散型: 名义型:饼图或条形图 有序型:饼图或条形图;累计频数和累积频率 连续型:描述统计量、图形;变量之间 离散与离散:条形图 离散与连续:直方图 连续与连续:散点图;性别与流失的关系不密切 手机品牌与流失的关系密切 使用量级别与流失之间有一定关系 话费合理性与流失之间有一定关系;1、三类数据挖掘模型 1)预测类(有监督的模型) 若干输入,一个目标 目标变量为离散型:Logistic回归、决策列表、贝叶斯网络、判别分析、最近邻算法、支持向量机、C5.0、CRT、QUEST、CHAID、神经网络 目标变量为连续型:回归分析、广义线性模型、最近邻算法、支持向量机、 CRT、CHAID、神经网络 时间序列预测模型:时间序列预测的目标是该数列未来的值 ;1)预测类模型(有监督的数据挖掘方法) 若干输入变量,一个目标变量 2)细分类模型 只有输入变量,无输出变量 聚类:K-means、Kohonen、Two-step 异常:Anomaly 3)关联规则模型(无监督的数据挖掘方法) 若干输入变量和目标变量 既是输入变量又是目标变量——两者 ;聚类——找到流失的客户群 决策树——生成规则集 神经网络——生成流失评分;聚类7: 14.7%,总花费较低;平均每分钟话费高;除免费时长外计费时长少;高峰与非高峰通话时间少;周末通话时间长;客户价值低 聚类4: 10.0%,周末通话次数少但平均每次通话时间长;周末通话时间占比低;高峰时期通话时间长;非高峰时期通话时间短;总花费较高;1:15个规则 0:14个规则;离散评分转化为连续评分 If churn=1 then churnscore=100.0 If churn=0 then churnscore=0.0 注意: 以$开头的都是预测结果

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档