- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于改进后的Kmeans聚类算法的网吧用户行为聚类,kmeans聚类算法改进,kmeans聚类算法,kmeans聚类算法matlab,kmeans聚类算法代码,kmeans聚类算法java,kmeans聚类算法原理,kmeans聚类算法应用,kmeans聚类算法c,kmeans聚类算法优化
安徽科技学院学报 ,2009,23(4):27~30
JournalofAnhuiScienceandTechnologyUniversity
基于改进后的K—means聚类算法的网吧用户行为聚类
叶良艳
(1.合肥工业大学 计算机与信息学院,安徽 合肥 230009;
2.安徽电子信息职业技术学院,安徽 蚌埠 233030)
摘 要:介绍了web日志挖掘概念,利用改进后 k—means聚类算法对网吧web日志挖掘 ,对网吧用户行为
聚类分析,找出用户的偏爱,以便网吧管理员更好定制网吧网络管理策略。
关键词 :WebEl志挖掘 ;聚类;K—means
中图分类号:TP393.07 文献标识码 :A 文章编号:1673—8772(2009)04—0027一o4
ClusteringUserBehaviorofInternetCafesBasedon
ImprovedK ——meansClusteringAlgorithm
YE Liang—yan。,
(1.CollegeofComputerScienceandInformation,HefeiUniversityofTechnology,
Hefei233009,China;2.AnhuiVocational
CollegeofElectronicsInfomrationTechnoloyg,Bengbu233010,China)
Abstract:ThepaperintroducestheconceptofWeb LogMiningandtheapplication oftheimprovedk——means
clusteringalgorithm analysisofInternetcafestodiscoversomecustomer~groupswith varied character,Sothat
theInternetcafenetworkadministrators managebetter.
Keywords:Weblogmining;Clustering;k—means
聚类是数据挖掘中一种重要的挖掘方法,它从数据库中计算对象间的相似性,并依此对对象进行分
类,使得不同类中的对象尽可能相异,而同一类中的对象尽可能相似,即 “物以类聚”,发现数据中隐含的
有用信息或知识。本文以网吧的web13志为数据,对网吧用户行为聚类分析,找出不同特征用户组,提高
网络服务的效率和个性化程度,以便网吧管理员更好定制网吧网络管理策略。
l Web挖掘技术介绍
Web挖掘是针对包括Web页面内容,页面之间的结构,用户访问信息等在内的各种Web数据源。在
一 定基础上应用数据挖掘的方法以发现有用的隐含的知识的过程。Web挖掘与传统的数据挖掘相比有
其 自身的特点。Web本身是半结构化或无结构的数据 ,缺乏机器可理解的语义,Web挖掘的对象是大量,
异质,分布的Web文档,对Web服务器上的31志、用户信息等数据所开展的挖掘工作也属于Web数据挖
掘的范畴。Web信息的多样性决定了挖掘任务的多样性。按照 Web处理对象的不同,一般将Web挖掘
分为3类:Web内容挖掘,Web结构挖掘和Web使用记录挖掘(如图1所示),针对这3种不同的处理对
象,能够挖掘出许多有用的信息。
收稿 日期:2009—02—24
作者简介:叶良艳(1981一),女,安徽省安庆市人,学士,助教,主要从事人工智能数据挖掘教学与研究。
28 安徽科技学院学报 2009正
图 1 Web数据挖掘技术的简单分类
Fig.1 W ebDataM iningsimpleclassification
2 聚类分析和K—means算法 .
K—means算法属于聚类方法中的一种划分方法,该算法具
您可能关注的文档
- 【精品教学法PPT】中学英语教学基本理念和发展方向(104页).ppt
- A.安全生产管理课程(59页).ppt
- ANSYS优化设计_练习(67页).ppt
- CFO基于价值的业绩管理-凯捷安永(20页).ppt
- CDR霓灯泡的制作(8页).doc
- DNAman使用方法(27页).ppt
- excel表格的基本操作(199页).doc
- Corey_有机合成路线设计的五大策略(28页).ppt
- GPS的应用及发展现状(37页).ppt
- GPS定位在海洋测绘中的运用(8页).ppt
- 广东省深圳市龙岗区德琳学校初中部2022-2023学年七年级上学期期中考试英语试题(原卷版+解析).docx
- 广东省珠海市第四中学、立才学校、梅华中学2022-2023学年七年级上学期期中质量检测英语试题(原卷版+解析).docx
- 教科版2024-2025学年六年级科学上册第一单元第4课时《生物细胞》同步练习(含答案).docx
- 牛津沪教版七年级英语上册单元速记•巧练 Unit 7 【单元测试 · 提高卷】.docx
- 牛津沪教版七年级英语上册单元速记•巧练 Unit 5【单元测试 · 基础卷】.docx
- 广东省深圳市南山区太子湾学校2022-2023学年七年级上学期期中考试英语试题(原卷版+解析).docx
- 广东省深圳市南山第二外国语学校(集团)2022-2023学年七年级上学期期中考试英语试题(含听力)(原卷版+解析).docx
- 牛津沪教版七年级英语上册单元速记•巧练 2023-2024学年七年级上学期期末英语全真模拟卷(深圳适用02).docx
- 广东省阳江市江城区2022-2023学年七年级上学期期中考试英语试题(原卷版+解析).docx
- 广东省梅州市梅县区宪梓中学2022-2023学年七年级上学期期中英语试题(原卷版+解析).docx
文档评论(0)