一种基于Web日志的Web用户群体和URL聚类算法.pdf

一种基于Web日志的Web用户群体和URL聚类算法.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于Web日志的Web用户群体和URL聚类算法

第30卷第4期 海南大学学报自然科学版 V01.30No.4 HMNANI】1叮VERSⅡTY Dec.2012 2012年12月 NATURALS删C雹JoI琅NAI,OF 文章编号:1004—1729(2012)04-0354一06 宁建飞 (罗定职业技术学院,广东罗定527200) 摘要:通过处理和研究Web13志,得到多数用户感兴趣的页面URL和具有相近访问爱好的用户群体,对 站点的结构是否适合用户作出判断并进行相应的调整,从而实现对用户的个性化服务. 关键词:Web日志;用户聚类;站点URL聚类 391 中图分类号:TP 文献标志码:A 当今社会,电子商务网站越来越被客户所接受,企业也越来越重视这种网络营销方式.当客户浏览网 站时,Web服务器将客户的浏览信息保存在Web日志中.为了帮助企业了解市场需求和改进决策,从而在 竞争中获得更大的优势,可以通过对Web日志进行筛选、整理和分析,获得其中的页面类属关系、客户类 属关系等,并以此作为优化Web站点拓扑结构的依据,制定更有效的市场营销策略.本文提出的Web用 户群体和相关URL聚类算法,在用户访问矩阵的基础上进行,根据访问矩阵计算列或行向量间的Manhat— tall距离,得到相似性度量.该算法直接利用用户对页面URL的访问频率,如实体现用户的访问行为,具有 较高的准确性,能够确定合理的聚类结果数目,还解决了聚类中普遍存在的子类问元素重复问题. 1 基本定义 览时间,用L=uip,uid,url,utime来表示Web服务器日志. 定义1 用户浏览行为嵋1 l。.url=uid。,,l≥1;hs表示到目前为止用户uid。浏览l。.眦l的次数. 定义2 of 却={(e∈E,{NumberPath}P)}“,P,m1,记录有向边及该有向边所在路径的编号,为有向边属性集. 定义3用户访问矩阵拉。 建立Web站点的用户访问矩阵(由定义1、2得),即 ● 一 hl,l h1,2 m ● h2,l h2.2 J 一 m : : ¨ ● ● ●

文档评论(0)

almm118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档