- 1、本文档共43页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用于电信业中无力偿还客户的决策支持的数据挖掘
Data mining for decision support on customer insolvency in telecom business 第一部分 应用背景及客户需求分析 为什么要建立这样一个决策支持来区分无力偿还客户? 情况描述: 电信公司与其他服务提供公司一样,经常会遭受无力偿还客户(使用了所提供的服务却没有付费)。尽管针对这些客户采取了一定的预防措施,然而在大多数情况下,这些措施显得太晚了,并且没有显著的作用。因此,一些客户逃脱付费的行为导致了公司财政遭受相当大的损失。 解决方法 在电信行业垄断局面被打破的今天,各方面竞争日益激烈,侦测和预防此类行为对该行业来讲是个重要的目标。建立一个可以事先预测客户无力偿还行为的可用的模型,对服务供应商来说就意味着一个有用的决策支持工具。 决定使用数据挖掘技术的原因 注意到电信公司收集到了大量的数据,这些数据涉及到公司与客户间交流的多个不同方面,这些数据可能包含了关于无力偿还预测的有价值的信息。比如: a)客户简介 b)所使用的服务 c)公司与客户间的经济联系 最终目标 与其他欺诈检测问题中的欺诈者相似,普遍认为无力偿还客户一般与其它客户表现不同,尤其是在该要付费的关键时期。 目标: 揭示这些行为模式,可以把无力偿还客户同其他的客户区别开来。 一些固有难题 一些固有的限制使得该研究是一个特殊的难题。 a)无力偿还客户的行为可归结为欺诈性结果或一些不从属客户意愿的因素(如不可抗力、社会因素)。很明显我们要研究的是前者,因为预测后者是相当困难的,实际上,后者的存在使得对前者的确认变得相当困难。 b)可获得的数据集,常常以一种有限而失真的方式表现各个客户。这是因为信息的来源只限于电信公司以及该公司所维护的关于客户的信息。由于各种道德和法律因素,这些信息不能和其他来源的信息相互联系,客户只是被表示为某些服务的使用者,而没有揭示其它可能影响客户行为模式或无力偿还行为的社会或财政方面的因素。 c)在大量可用的数据中,可以定义许多参数,常常由主要的交易数据演绎而来,可以描述客户行为。绝大多数相关参数的选择对我们的问题来讲是个冗长乏味的过程,部分基于统计分析工具技术,部分基于相关研究人员对所给问题的参数重要性的理解。因此,确定这些参数的子集,并随后使用适当的工具来选出大部分相关参数是个关键的阶段。 第二部分 类似应用问题的回顾 电信公司对无力偿还客户的预测和以下几个领域的欺诈检测问题相似。 a)移动通讯 b)常规通讯 c)信用卡或名片操作 几个问题的共同点: a)提供服务的公司收入损失显著,超出了允许的毛差额。 b)无法预测的人类行为给欺诈检测带来了相当大的困难。 c)只有在处理了海量数据后才能获取信息。 d)欺诈案例很少与合法的作比。 第三部分 无力偿还检测 ——KDD过程的结果 KDD的9个步骤 1)问题定义和应用领域 2)创建目标数据集 3)数据清洗和预处理 4)数据缩减和投影 5)选择数据挖掘函数? 6)选择数据挖掘算法 7)实施数据挖掘 8)解释结果 9)利用发现的知识 1)问题定义和应用领域 无力偿还预测的功能: 可预测拒绝在接下来的支付日拒绝支付电话帐单的无力偿还客户,以便于电信公司仍有时间采取预防措施。 三个目标 为该公司设定的3个主要目标: 1)检测到尽可能多的无力偿还客户 2)最小化虚假警报,比如:有偿还力的客户被错判为无力偿还的客户 3)及时对SP发出警告以便对可能的无力偿还者采取措施。 帐单过程(BP)的时间序列图 研究项目的任务 调查研究如下的假设: 无力偿还客户在BP结束及之前的一个关键时期内,他们的呼叫习惯和电话使用通常会发生变化。此外,呼叫习惯的改变和支护习惯的模式都被检验是否可以对未来的无力偿还行为进行安全的预测。 2)建立一个目标数据集 客户行为可能由许多特征来描述,大部分不能简单的从信息系统和电信设备操作中获得。 对本研究来讲,可得的两种数据: 1.统计客户信息(客户资料) 2.可提供帐单信息,支付行为和电话服务使用情况(CDR)的时间依赖数据。 涉及的未加工数据 前提:数据被整合并保存在一个为此研究目标而构建的数据仓库中。 在本研究中所涉及的未加工数据: ? 来自客户资料的客户信息 ? 来自交换中心的电话连接信息 ? 来自帐单信息系统的帐单数据 ? 来自帐单信息系统的客户支付报告 ? 由于支付失败而引起的电话连接断开报告 ? 支付后电话重新连接的报告 ? 永久废弃合同的报告 数据来源情况 地域跨度: 数据来自三个不同的地域,农村、半农村、工业区/城镇。 数据量:三个数据的共100,000客户。 时间跨度:17个月,即 帐单数据从 10/1999~2/20
您可能关注的文档
- 生物系统分类-植物分类.ppt
- 生物膜系统及线粒体和叶绿体的观察.ppt
- 生物与环境的相互影响(北师大版七年级上册).ppt
- 生物的分类.1.ppt
- 生物选修3知识大综合.doc
- 生物选修1菊花的组织培养.ppt
- 生物进化的原因_苏科版.ppt
- 生物选修3专题一1.1.ppt
- 生物与环境的相互影响(我的)1.ppt
- 生物高三复习基因突变2013.ppt
- DB13T 1209-2010饲料 复合预混料通则.docx
- 钢筋砼管顶管穿越建筑群施工的观测与分析.pdf
- DB13T 1334-2010 物流零担货运服务规范.docx
- DB13 T 1187.2-2010 称重类社会公正计量站服务规范 第2部分:电子轨道衡称重.docx
- DB13_T 1329-2010 韭菜病虫无公害防控技术规程.docx
- 立足技术创新 推行清洁生产 开创集团公司环境保护工作新局面——在集团公司清洁生产技术交流会上的总结报告.pdf
- 公司员工安全生产职责制度文档.pptx
- 厨房员工培训制度文档.pptx
- DB13╱T 1223-2010 化工产品的碘值测定方法.docx
- 逆作法在顶管施工井中的应用.pdf
文档评论(0)