- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
工程硕士学位论文
关联规则在服装销售行业的应用研究
AAA
北京工业大学
摘 要
数据挖掘(Data Mining)是近十几年中迅速发展起来的交叉学科,它融合了数据库、人工智能、统计学等多个领域的理论和技术,搭建了上述理论研究与实际应用间连接的桥梁,应用范围广泛。本文提出了利用数据挖掘技术对某服装企业的销售数据进行挖掘分析研究,以求找到大量数据背后潜在的信息;并给出了研究工作的思路和方法;得出了部分对企业有意义的信息并积累了一定的工作经验。
本文首先概述了数据挖掘理论和发展,以及主要的数据挖掘技术;然后,基于某服装企业02年到07年的销售数据,重点研究了关联规则在销售数据上的应用问题。 主要内容包括: 首先对原有数据进行了预处理 ;其次运用了Apriori算法产生了大量的关联规则;再次使用了闭频繁项集和最大频繁项集概念结合Apriori算法来解决规则冗余问题;最后应用作用度(Lift)对所挖掘出的规则进行评估,去掉负关联规则后,用服装行业知识对剩余的正关联规则进行评判筛选,找出对服装企业有用的规则。
试验结果表明由于使用的数据集自身的问题,应用闭频繁项集消除规则冗余的效果并不明显,而使用最大频繁项集理论在消除冗余规则方面效果十分显著。并且通过应用作用度(Lift)对规则的评估后得出部分对服装企业有意义的规则,对该行业今后的生产和销售有一定的指导作用
Abstract
Data Mining is the most popular intercross subject in the last decade. It integrates several areas of theories and technologies, such as the Database, Artificial Intelligence and Statistics, becomes the bridge to connect the theory research and practical applications, and is wildly used. This thesis illuminates utilizing the data mining technology for one costume enterprise to process the data mining research on its sales data, in order to find potential information behind the enormous data; it also presents the idea and method for how to process the research work. From the research described in the thesis, some significative information for the enterprise are achieved, and we also get certain research experience on the area.
This thesis first summarizes data mining theory, its evolution and its primary data mining technology. Then it focuses on the research of applying the data mining technology of association rules to one costume enterprise’s sales data, which are collected from financial year 2002 to 2007. The following main contents of the research are included in the thesis: first the original data is pre-processed, then the classic Apriori algorithm is applied on the data to generate plentiful association rules. In order to eliminate a mass of redundant rules, the theory of frequent closed itemsets and the maximal frequent itemsets are utilized with the Apriori algorithm
您可能关注的文档
- 《电气专业外文翻译--紧凑的高阶谐波抑制(适用于外文翻译+中英文对照)》-毕业论文设计(学术).doc
- 《电气专业外文翻译--微控制器(适用于外文翻译+中英文对照)》-毕业论文设计(学术).doc
- 《电视RF-AV转换电路的设计》-毕业论文设计(学术).doc
- 《电炭黑/聚乙烯热塑性复合材料的制备和性能》-毕业论文设计(学术).doc
- 《电梯安装工艺分析与研究》-毕业论文设计(学术).doc
- 《电信管理员管理系统》-毕业论文设计(学术).doc
- 《电永磁磁力夹紧系统的应用及发展》-毕业论文设计(学术).doc
- 《电子计分器设计与实现》-毕业论文设计(学术).doc
- 《电子商务对农村发展的影响与农民对策研究》-毕业论文设计(学术).doc
- 《电子商务中消费者评价系统的分析》-毕业论文设计(学术).doc
文档评论(0)