- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘应用实例 IBM的通用数据挖掘方法论 IBM的“通用数据挖掘方法”(The generic data mining method)将数据挖掘的全过程归纳为7个步骤。 1.明确的定义商务问题,并从技术的角度考虑商务问题。 2.确定要使用的数据挖掘模型。 3.按模型的要求确定数据源并进行数据准备工作。 4.评估数据质量。 5.根据商务或技术问题的性质,选择一种挖掘技术或几种挖掘技术的组合进行数据挖掘。 6.理解挖掘结果并从挖掘结果中检测新的模式。 7.将挖掘结果应用到具体业务中,使得商业利润最大化与企业形象最佳化。 客户群细分挖掘技术在电 信行业中的应用结果举例 某电信公司运用聚类算法进行客户群细分的应用案例 在进行客户细分之前,首先需要从业务系统或者经营分析系统中抽取出适当的数据,包括以下数据字段。 使用IBM Intelligent Miner进行客户细分 聚类分析时,选定 K=9(作为聚类算法的参数),得到9个不同的客户群,每个客户群的特点及主要统计特性如下表所示。 解释结果-对客户群5的属性进行统计分析和描述 客户群5具有这样一些特点: 对几乎所有的增值业务感兴趣; 在所有时段内通话时长都很低; 呼出电话号码数很少; 入网时长较长; 年龄在40~50岁之间,为小业主(职业)。 客户群5的特征图 * * IBM 的 通 用 数 据 挖 掘 方 法 夜间呼叫时长 国际长途话费使用时长 国内长途话费使用时长 工作时间呼叫时长 总呼叫时长 呼叫行为数据 性别 工作单位 收入 年龄 用户数据 需要用到的数据字段 最近半年的话费 客户级别(钻石、黄金、白银……) 网内通话数据 付费方式(后付费、预付费……) 使用的资费套餐 其他类型的数据 使用免费业务的种类数量 使用的点播类数据业务数量 打折业务数据数量 使用的数据业务种类数量 使用的语音业务种类数量 使用的服务类型 0.46 8.4% 低 很少 18.1% 基础群体 8 0.70 9.5% 低 少 13.6% 经济群体 7 0.93 11.1% 低 中等 11.9% 保守用户 6 0.65 6.3% 高 少 9.7% 使用增值业务的用户 5 0.88 6.9% 低 中等 7.8% 晚间客户 4 1.35 15.0% 低 频繁 11.1% 本地客户 3 0.95 7.1% 高 中等 7.5% 年轻客户 2 1.64 13.9% 高 很频繁 8.5% 真正的移动客户 1 1.82 21.8% 中等 很频繁 12.0% 年轻而且消费能力强的客户 0 利润比例除以客户比例的比率 利润的比例 使用其他增值业务的频率 呼叫 行为 占总体客户 的比例 客户群名称 客户群 编号
文档评论(0)