基于时间密度的Web日志用户浏览行为分析.pdf

基于时间密度的Web日志用户浏览行为分析.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于时间密度的Web日志用户浏览行为分析.pdf

计算机科学2004V01.31N-o4 基于时间密度的Web日志用户浏览行为分析 庄力可1张长水1勒中坚z (清华大学智能技术与系统国家重点实验室 北京100084)1(江西财经大学计算机系 南昌330000)2 摘要本文针对Web日志中用户套话识别阚值同题,培出一种基于时间密度的撅度分析方法。文中首先特基于时 问问膈枣数刘度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;蠊后建立频度与IP用户的相关 矩阵t矩阵的列为访问频度,矩阵的行为用户IP,矩阵中的每一个值为莱一时间间隔的访问频度。通过列向量的聚类 分析,对不同类剥用户的访问行为进行探讨。最后,对合话识剐的阙值进行参数估计,井通过抽样对闰位进行辁洲和参 数修正。 关键词Web日志挖掘,时间间隔.频度分布,随机向量,套话闽值 1研,弋 of BehaviourinWeb BasedonTime Analysis Log Browsing Density zHuANGLi-KelZHANG Chan-SuilLE zhonE_jian矿 Labof and (StateKey Sy8terns,Ts IntelligentTeehnology LnshuaUniversity,Beiiing。100084)1 of (Departmentof UniversityFinanceand Computer·Jiansxi Economics·Najehang,330000)2 Abstract thethresholdofsession inWeb methodbasedontime Facing recognizelogmining,afrequencyanalysis intervalisintroducedFirst.thevisitor ofuserbasedoilscale ot isdefinedasa frequency parametertimeinterval random vector.TheCUt—tail forrandomvectorisalso IPrelevantmatrixis algorithm given.Second,afrequency—user set istakenasrowanduserIPistaken8scolumn.andeachelement’svalueofthismatrixisthe up·wherefrequency user’s visitor oilthetimeinterval.ThedifferentIPusers8reclassified between frequency bymeasuringsimilarity columnvectorsandthe behaviouris andtest

您可能关注的文档

文档评论(0)

我的文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档