HFP-growth算法在wap日志挖掘上的应用研究.pdf

HFP-growth算法在wap日志挖掘上的应用研究.pdf

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要 摘 要 随着网络的普及,网络用户的日益增多,在服务器端和客户端都产生了大 量的网络日志,这些海量数据如果不加以利用,就是死海。所以,应运而生地, 有了数据挖掘这一学科。而Web日志挖掘正是数据挖掘针对Web产生的分枝。 通过对网络日志的分析和处理,可以找出用户的行为模式,比如兴趣爱好,这 样大量的数据就得到了应用,让沉寂的大海有了生命。Web日志挖掘的应用有 利于电子商务系统的建立、发掘潜在的客户分析、提高网站的建设性能等方面。 网络的发展延续到了手机时代,目前用手机上网的客户群不占少数,所以 WEB日志挖掘有必要延伸到WAP日志的挖掘方向。目前在这一方面的研究成 果还不是很多,但从用户群的数量可以看出,这一方面的学术研究会越来越被 重视。WAP日志跟WEB日志稍有不同,预处理的时候可以不用考虑用户识别 的问题,可以简单的把同一手机号码认为是同一用户,而挖掘的过程大相径庭, 基本上都是实现对ud的数据分析,WEB挖掘的方法同样适用于WAP日志数据。 本文系统地介绍了数据挖掘产生和发展的状况,同时讨论了数据挖掘的流 程及各流程的技术方法。尤其对Web日志的挖掘,进行了深入的探讨。首先, 对预处理的各步骤及方法进行了详细的介绍,还配合了对WAP日志的处理,同 时对真实数据进行处理,为后面挖掘工作做好准备。其次,对关联规则的两大 算法的不足,提出了新的HFP.growth算法,最后对这三个算法进行了比较,和 举例说明,最后我们选择用HFP.GROWTH算法来完成这次系统的挖掘工作。 最后,我们对挖掘系统在VS2010上实现了挖掘,系统包括了数据预处理和数据 挖掘两大模块,并应用到了真实的WAP日志数据上,得到了较为满意的答案。 关键词:WAP日志挖掘;关联规则;HFP—GROWTH算法;日志预处理 ABSTRACT ABSTRACT ofthe moreIntemet aremass Withthe Internet,and users,there popularization thosedatacallnotbe will datainserversideandclientside.If used,it logging risein totheconditions.Web becomethedeadsea.Sothedata log mining response data inWeb and of isabranchof processing mining mining production.Foranalysis as find theuser’sbehavior hobbies.A theweb call out patterns,such large log,we beusedfor amountofdatahasbeen deadsea Webcall applied,thealive.Mininglog

您可能关注的文档

文档评论(0)

cxmckate + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档