基于粗糙集的决策树在电子商务中的应用.docx

基于粗糙集的决策树在电子商务中的应用.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于粗糙集的决策树在电子商务中的应用 吴学辉1 张月琴2 ( 1. 运城学院计算机科学与技术系,山西 运城 044000; 2. 太原理工大学计算机与软件学院,太原 030012) 摘 要: 将数据挖掘中的决策树与粗糙集理论进行有机结合,提出一种基于粗糙集属性依赖度的决策树算法,将该 算法应用到电子商务的客户管理中,进行电子商务客户价值研究,提取分类规则,为企业管理客户提供决策支持。 关键词: 粗糙集; 决策树; 电子商务 中图分类号: TP18 文献标识码: A 文章编号: 1673 - 1980( 2014) 01 - 0150 - 04 随着互联网技术的发展,电子商务逐渐改变着 传统经营模式,特别是企业与客户之间的关系。企 业最关心的是: 谁是最有价值的客户,如何实现这些 客户价值最大化等,这些都需要进行客户价值分析。 通过分析可以为客户提供个性化的服务,使企业以 最小化的投入获得最大的回报。当前许多企业的网 站服务器端记录着大量的客户特征信息和行为信 息,但是对这些信息缺乏深层次的分析。决策树是 数据挖掘中的一种重要的数据分析方法,它主要用 来进行数据的分类和预测,其主要优点是分类速度 快,效率高[1 - 2]。缺点是当属性比较多时,分类能力 较差,难以发现有用的规则。粗糙集也是一种处理 不完备信息的有效工具,因为它不需要先验知识,所 以适合处理不确定性问题。粗糙集已经广泛应用在 在最终构建的决策树中,每一条从根节点到叶节点 的路径对应着一条规则。因此,它在数据挖掘中应 用非常广泛。 决策树算法中,最经典的是 ID3 算法,该算法以 信息论中的信息熵和信息增益度为标准,实现对数 据的归纳分类。由于 ID3 算法只能处理离散型属 性,所以它的应用受到一些限制,在它之后的 C4. 5、 CART、SLIQ、SPRINT 都 是 对 ID3 算 法 进 行 了 相 关 改进[5]。 1. 2 粗糙集理论 1982 年,波 兰 教 授 Pawlak Z 提 出 了 粗 糙 集 ( Rough Set) 的概念。粗糙集的基本思想是利用已 存在的知识库,将不精确或不确定的知识用已知的 知识库中的知识来近似刻画。它是一种处理不确定 数据预处理、消除冗余信息等方面[3 - 4]。 [ ] 本文以数据挖掘中的决策树和粗糙集理论为基 础,将二者有机结合,提出了一种基于粗糙集属性依 赖度的决策树算法,并将此算法应用于电子商务客 户价值分析,提取相关规则,为企业决策提供实质性 的建议和指导。 1 基本概念 1. 1 决策树算法 决策树是数据挖掘中的一种分类方法,决策树 算法的主要思想是: 以信息论为基础,找出具有最大 信息增益的属性字段,以该属性字段的不同取值构 造决策树分支,然后在每个分支中递归构建决策树。 信息的方法 6 - 8 。本文研究中所涉及的粗糙集相关 理论如下: 定义 1 粗糙集 S = < U,R,V,F > ,X  U 为 U 上的一个概念,∪ { [x]R ∈ UR | [x]R ∩ X ≠ } 也是一个概念,当 X 是属性子集 R 所确定的 U 上的 不分明集的并时,即 X 是 R 可定义的,R 的可定义集 即为 R 的精确集,否则 X 是 R 不可定义的,R 的不可 定义集即为 R 的非精确集或粗糙集。 定义 2 ( 不可分辨关系) S = < U,R,V,F > , 设 P  R,P ≠ ,P 上的不可分辨关系定义为 P 中 所有等价关系的交集。也记为 IND( P) : [x]IND( P) = ∩ [x]R R∈P 收稿日期: 2013 - 08 - 25 基金项目: 山西省自然科学基金项目( 2008011028 - 1) 作者简介: 吴学辉( 1978 - ) ,男,山西运城人,硕士,太原理工大学计算机与软件学院讲师,研究方向为数据挖掘和粗糙集。 定义 3 ( 上近似、下近似) 令 X  U,则RX 和 RX 称为 X 关于 R 的上近似和下近似。 RX = ∪ { [x]R ∈ UR | [x]R ∩ X ≠ } RX = ∪ { [x]R ∈ UR | [x]R  X} 定义 4 ( 边界、正域、负域) 集合 BNG( X) = RX - RX 称为 X 的 R 边界; POSR ( X) = RX 称为 X 的 R 正域; BNG( X) = U - RX 称为 X 的 R 负域。 定义 5 ( 关系独立、关系依赖) 设 S = < U,R, V,F > ,属性 P ∈ R,IND( R) = IND( R - { P} } ,则 称 P 在 R 中是可缺的,

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档