- 1、本文档共126页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
web使用挖掘的理论与方法研究管理科学与工程专业论文
摘要随着Internet的迅速发展,World
摘要
随着Internet的迅速发展,World Wide Web已深入到人类生活的方方面 面。面对Web上的海量信息,如何充分利用这些宝贵的数据资源,从具有动 态、异质、半结构化等特性的Web数据中提取人们感兴趣的、隐含的、有应 用价值的知识,已成为当前数据挖掘领域的一个重要研究课题。
Web数据挖掘便是在这种背景下产生的,从一出现开始就显示出了巨大 的潜在价值和广阔的发展前景。它将传统的数据挖掘与Web有机地结合起 来,从Web资源中发现有效的,潜在有用的,并且最终可理解的知识和模式, 它涉及到数据挖掘、信息学、机器学习、人工智能、计算机网络技术等多个 领域。
web数据挖掘包括web内容挖掘、w曲结构挖掘和web使用挖掘三部 分,其中最有意义的部分是Web使用挖掘,因为它同用户的行为密切相关。 本论文重点研究w曲使用挖掘,目标是从Web的用户访问信息中挖掘用户 的访问模式,分析用户的访问行为,为确定市场战略和发展电子商务提供依 据,同时也为改进网站设计、完善对用户的个性化服务等创造有利的条件。
首先,本文研究了聚类和关联规则等与Web使用挖掘有关的理论和技术 基础,提出了Web使用挖掘的系统框架,阐明了从Web数据预处理、Web 用户访问路径模式发现、Web聚类分析和特征规则挖掘等方面开展对w曲数 据进行使用挖掘的研究思路。
在Web使用挖掘的数据准备方面,系统地研究了Web数据预处理的数 据清理、用户识别、会话识别、路径补充和事务识别等过程,设计了有关算 法,并实现了Web数据预处理的自动化系统,同时用实际Web网站服务器 中的日志数据加以验证。
在Web用户访问路径模式发现方面,研究了用户访问模式挖掘的理论和
方法。在分析基于偏爱度的用户访问路径挖掘模式的基础上,提出了基于页 面层次和喜爱度的用户浏览频繁路径获取方法,并实现了原型系统,阐明了 全面考虑支持度、用户浏览时间和页面层次三种因素的用户浏览频繁路径发 现技术。
在Web聚类方面,系统地研究了度量聚类对象相似度的方法,并根据web 特点,研究了基于页面间链接距离的页面聚类方法。在Web用户聚类方面, 探索了一种基于矩阵变换的Web用户聚类方法,系统地考虑聚类对象之间的
哈尔溟工业大学管理学博士学位论文曼i
哈尔溟工业大学管理学博士学位论文
曼i ql p III II I II II II I__曼曼皇曼皇
相互作用和影晌。
现有的Web关联规则挖掘主要考虑对用户访问页面的支持度和信任度。 本论文结合Web使用挖掘的特点,研究了带有时间戳的Web关联规则挖掘 方法,并研制了相应的原型系统。
论文还研究了从用户网站登录信息中挖掘出与商品销售有关的知识的方 法,提出了运用背景知识与面向属性归纳挖掘特征规则的思路。论文通过试 验,实现了挖掘特征规则的原型系统,进一步提高了对规则的解释能力。
综上所述,论文系统地研究了Web使用挖掘过程,探索了从海量和半结 构化的Web数据中挖掘隐含知识的理论和方法,设计并实现了多个具有可视 化特点的原型,做到了理论与实际相结合,为Web使用挖掘的进一步发展提 供了更为广阔的空间。
关键词Web使用挖掘;Web数据预处理;Web聚类
AbstractWith
Abstract
With the quick development of internet,World Wide Web has permeated
every aspect of human life.Challenged by the huge body of information on the web,how tO make an adequate use of the data resource and how to extract the
interesting,implicit and valuable knowledge has become an enormously important topic of research in the field of data mining.
To meet this challenge,data mining has come into being with great potential value and broad development prospect.It combines traditional data mining with
web,extracts effective,potential,understandable knowledge and patterns from web resource.It involves many fields suc
您可能关注的文档
- 二氧化碳氧气混合干燥保存周围神经的实验研究外科学手外科专业论文.docx
- 安阳地区电网十二五规划研究电气工程专业论文.docx
- 电子商务中专业领域货源信息检索系统的设计与实现系统工程专业论文.docx
- 高中思想政治课同课异构实施研究学科教学思政专业论文.docx
- λ噬菌体red重组系统介导的靶向突变及其机理的研究生物化学与分子生物学专业论文.docx
- 差分光学吸收在线测量有害气体研究光学专业论文.docx
- 大学英语四级听力测试对大学英语听力教学反拨效应的实证研究学科教学英语专业论文.docx
- 仿刺参apostichopusjaponicus水溶性海参皂苷的分离纯化及其药理活性研究水产养殖专业论文.docx
- 生态批评翻译实践报告英语笔译专业论文.docx
- 包含静止同步补偿器的电力系统稳定性分析与非线性鲁棒控制控制理论与控制工程专业论文.docx
- 2024年学校党总支巡察整改专题民主生活会个人对照检查材料3.docx
- 2025年民主生活会个人对照检查发言材料(四个带头).docx
- 县委常委班子2025年专题生活会带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”对照检查材料四个带头:.docx
- 巡察整改专题民主生活会个人对照检查材料5.docx
- 2024年度围绕带头增强党性、严守纪律、砥砺作风方面等“四个方面”自我对照(问题、措施)7.docx
- 2025年度民主生活会领导班子对照检查材料(“四个带头”).docx
- 国企党委书记2025年度民主生活会个人对照检查材料(五个带头).docx
- 带头严守政治纪律和政治规矩,维护党的团结统一等(四个方面)存在的问题整改发言提纲.docx
- 党委书记党组书记2025年带头增强党性、严守纪律、砥砺作风方面等“四个带头”个人对照检查发言材料.docx
- 2025年巡视巡察专题民主生活会对照检查材料.docx
文档评论(0)