- 1、本文档共43页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE 9
w
w
MACROBUTTON MTEditEquationSection2 SEQ MTEqn \r \h \* MERGEFORMAT SEQ MTSec \r 1 \h \* MERGEFORMAT SEQ MTChap \r 3 \h \* MERGEFORMAT 学号:
Web事务聚类分析的研究与实现
Research and Implementation of Web Transactions Clustering Analysis
系 别: 啊啊啊啊
专 业: 啊啊啊啊啊啊
班 级: 啊啊啊啊
学生姓名: 啊啊啊啊
指导教师: 啊啊啊啊 (职称)
日 期: 年 月 日
w
摘要
本文系统、完整地论述了Web事务聚类分析的两个阶段,即数据预处理和聚类分析阶段。其中数据预处理阶段又包括日志解析、数据清洗、用户识别和事务识别四个过程;同时,论文在此阶段引入了“概念URL”,以获得容易理解的聚类结果。在聚类分析阶段,本文结合蚁群优化的原理,建立了人工蚂蚁模型,并基于该模型实现了蚁群聚类分析算法。另外,本文还在聚类分析过程中使用了K均值算法,并比较了蚁群算法和K均值算法在Web事务聚类分析上的优劣。采用北京电子科技学院Web服务器()日志作为数据集的试验表明,本文的技术和方法能够获得质量良好的聚类结果。
【关键词】Web事务 聚类分析 概念URL K均值 蚁群算法
Abstract
This paper discusses the two phases, which are data preprocessing and clustering analysis, in Web transactions clustering analysis in a systematic and complete view. The data preprocessing phase also contains the procedures of log file interpretation, data washing, user identification and transaction identification; at the same time, in order to gain an easily interpreted result, the paper introduces the “Concept URL” in this phase. In clustering phase, a model of artificial ant is set up. Based on this model, the paper implements an ant-colony clustering algorithm. What’s more, k-means algorithm is also implemented in clustering analysis phase, the result is compared with that of ant colony algorithm. Experiment results are presented on web logs of to illustrate the techniques and methods. The quality of results is good.
【Keywords】Web Transaction; Clustering Analysis; Concept URL; k-means; Ant Colony Algorithm
目录
TOC \o 1-2 \h \z \u HYPERLINK \l _Toc199735741 1 绪论 PAGEREF _Toc199735741 \h 4
HYPERLINK \l _Toc199735742 1.1 问题的提出 PAGEREF _Toc199735742 \h 4
HYPERLINK \l _Toc199735743 1.2 数据挖掘 PAGEREF _Toc199735743 \h 4
HYPERLINK \l _Toc199735744 1.3 聚类分析 PAGEREF _Toc199735744 \h 6
HYPERLINK \l _Toc199735745 1.4 Web挖掘和Web事务聚类分析 PAGEREF _Toc199735745 \
您可能关注的文档
- 《SMC的发展现状及成型工艺》》-毕业论文.doc
- 《SMS复合非织造材料纵横向机械性能差异的因素的研究分析》》-毕业论文.doc
- 《SMT技术的发展趋势》》-毕业论文.doc
- 《SMT技术的发展趋势》-毕业论文.doc
- 《SL1126发动机机盖的工艺工装设计》》-毕业论文.doc
- 《SMT检测与质量管理》-毕业论文.doc
- 《SMT生产线的运行与维护》》-毕业论文.doc
- 《SMT生产工艺流程》》-毕业论文.doc
- 《SNMP_XML转换网关的设计与实现》》-毕业论文.doc
- 《Snort研究与应用》》-毕业论文.doc
- 中考语文总复习语文知识及应用专题5仿写修辞含句子理解市赛课公开课一等奖省课获奖课件.pptx
- 湖南文艺版(2024)新教材一年级音乐下册第二课《藏猫猫》精品课件.pptx
- 湖南文艺版(2024)新教材一年级音乐下册第三课《我向国旗敬个礼》精品课件.pptx
- 高中生物第四章生物的变异本章知识体系构建全国公开课一等奖百校联赛微课赛课特等奖课件.pptx
- 整数指数幂市公开课一等奖省赛课微课金奖课件.pptx
- 一年级音乐上册第二单元你早全国公开课一等奖百校联赛微课赛课特等奖课件.pptx
- 八年级数学上册第二章实数27二次根式第四课时习题省公开课一等奖新课获奖课件.pptx
- 九年级物理全册11简单电路习题全国公开课一等奖百校联赛微课赛课特等奖课件.pptx
- 八年级语文下册第五单元19邹忌讽齐王纳谏省公开课一等奖新课获奖课件.pptx
- 2024年秋季新人教PEP版3年级上册英语全册教学课件 (2).pptx
文档评论(0)