- 1、本文档共24页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chapter17电信业客户流失分析
电信业客户流失分析;案例背景
商业理解
数据理解和数据准备
建立模型与模型评估
模型的应用及营销预演
;客户——尤其是有钱有需求的客户是有限的
如何在客户即将流失之前发现他们,并对其特征进行刻画,从而挽留他们
多看看模型的构建、解读、验证和应用,不要过多纠缠于数据字段是否全面
决策树、神经网络、聚类模型;问题1:哪些客户可能会流失?
问题2:可能流失客户的特征是什么?
问题3:市场挽留活动的预计收益是多少?;不流失
自愿流失:销号
非自愿流失:欠费;客户基本信息
客户行为数据
客户交互数据
客户态度数据;自变量:1-7月
预测变量:8-10月;预期收益
=流失客户预期收入
-流失客户挽留预期成本;1、数据基础
客户基本信息表(编号,性别,年龄,在网时长,话费方案,手机型号)
客户通话情况表(编号,高峰时电话数,高峰时电话时长,低谷时电话数,低谷时电话时长,周末时电话数,周末时电话时长,国际电话数,国际电话时长,月份);话费方案表(话费类型,固定费用,免费时长,高峰时期单价,非高峰时期单价,周末单价,国际长途单价)
客户是否流失标记表(客户编号,是否流失);(1)单变量的变换
(2)衍生变量
(3)趋势类变量
(4)波动类变量;连续?连续:
便于计量和比较:如单位归一
修正数据的分布:如倒数、对数
标准化:如(原值-平均值)/标准差、 (原值-最小值)/( 最大值-最小值)
连续?离散:分箱(等距离、等数量、平均值加减三个标准差)
离散?连续:Likert量表
离散?离散:a,b,c?0,1;横截面数据(某一时点)
强度相对指标:如通话时长/通话次数
比例相对指标:如高峰时通话时间/总时间
时间序列数据(时间排序)
滞后类指标:如与去年同月相比、股价5日平均
汇总类指标:6个月的数据?一份数据;趋势值=;
波动值=;单个变量:
离散型:
名义型:饼图或条形图
有序型:饼图或条形图;累计频数和累积频率
连续型:描述统计量、图形;变量之间
离散与离散:条形图
离散与连续:直方图
连续与连续:散点图;性别与流失的关系不密切
手机品牌与流失的关系密切
使用量级别与流失之间有一定关系
话费合理性与流失之间有一定关系;1、三类数据挖掘模型
1)预测类(有监督的模型)
若干输入,一个目标
目标变量为离散型:Logistic回归、决策列表、贝叶斯网络、判别分析、最近邻算法、支持向量机、C5.0、CRT、QUEST、CHAID、神经网络
目标变量为连续型:回归分析、广义线性模型、最近邻算法、支持向量机、 CRT、CHAID、神经网络
时间序列预测模型:时间序列预测的目标是该数列未来的值
;1)预测类模型(有监督的数据挖掘方法)
若干输入变量,一个目标变量
2)细分类模型
只有输入变量,无输出变量
聚类:K-means、Kohonen、Two-step
异常:Anomaly
3)关联规则模型(无监督的数据挖掘方法)
若干输入变量和目标变量
既是输入变量又是目标变量——两者
;聚类——找到流失的客户群
决策树——生成规则集
神经网络——生成流失评分;聚类7: 14.7%,总花费较低;平均每分钟话费高;除免费时长外计费时长少;高峰与非高峰通话时间少;周末通话时间长;客户价值低
聚类4: 10.0%,周末通话次数少但平均每次通话时间长;周末通话时间占比低;高峰时期通话时间长;非高峰时期通话时间短;总花费较高;1:15个规则
0:14个规则;离散评分转化为连续评分
If churn=1 then churnscore=100.0
If churn=0 then churnscore=0.0
注意:
以$开头的都是预测结果
您可能关注的文档
- CH4保险基本原则.ppt
- CH4_无线信道容量.ppt
- 思想_表达二分法的检讨_李雨峰.pdf
- 怎样设计松杉灵芝口服液项目可行性分析报告.pdf
- 怎样当好班组长(IE 必修).pdf
- Ch4.1 随机变量的数学期望.ppt
- 怎样研究算法-排序算法研究示例.pdf
- Ch7 金融市场 练习题.ppt
- 思域培训资料.pdf
- CH3 结构力学龙驭球静定结构(中英).ppt
- (高清版)DB4113∕T 071-2024 猕猴桃园杂草绿色调控技术规程.pdf
- (高清版)DB4107∕T 491-2021 地理标志产品 师寨黑米醋.pdf
- (高清版)DB4106∕T 18-2020 居家和社区养老助浴机构服务规范.pdf
- (高清版)DB4114∕T 153-2021 奶牛乳房炎防治技术规范.pdf
- (高清版)DB4106∕T 57-2022 社会化环境检测机构服务规范.pdf
- (高清版)DB4114∕T 116-2019 商芝1306芝麻生产技术规程.pdf
- (高清版)DB4113∕T 061-2024 水稻直播高产栽培技术规程.pdf
- (高清版)DB4107∕T 481-2021 卫红花生产技术规程.pdf
- (高清版)DB4107∕T 493-2022 鲤鱼池塘养殖技术规程.pdf
- (高清版)DB4105∕T 221-2023 胡萝卜编绳直播栽培技术规程.pdf
文档评论(0)