- 1、本文档共104页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
电子商务概论--网络营销.ppt
* * 互联网 浏览器缓存 Web浏览器 Web页面 Web服务器 请求 对象 Web日志 Web页面 图片、视频 Cookie 主讲人:舒彤 博士 手机 Email * * Web使用挖掘(WUM)是使用数据挖掘技术分析网站服务器上的Web 日志数据,发现、抽取出消费者的访问行为模式和兴趣,获得潜在有用的知识的过程。 WUM涉及的数据变量一般包括用户访问的URL、页面的大小、请求的时间、在页面上停留的时间、请求者的地址、用户、服务器状态等。 WUM一般需要经过数据预处理、模式发现、模式分析等过程。 预处理的目的是为模式发现阶段提供可靠完整的数据源,主要包含两项任务:数据清洗和事务识别。 模式发现是根据具体的目标需求选择某种发现技术(如关联规则发现、序列模式发现、聚类和分类等)挖掘访问记录中的访问模式。 模式分析的目的是使所发现的用户模式易被理解和使用。 5.6 面向Web日志数据的个性化推荐:Web使用挖掘 主讲人:舒彤 博士 手机 Email * * WUM有广阔的应用领域,可提供Web个性化、在线推荐、商务智能、寻找目标客户等营销手段,还可改善系统安全、负载平衡、站点结构等系统性能。 Web挖掘 Web内容挖掘 Web使用挖掘 Web结构挖掘 个性化 系统改善 网站修改 商业智能 使用特性 主讲人:舒彤 博士 手机 Email * * 5.7 面向Web日志数据的个性化推荐:WUM方法 聚类 聚类(clustering)是把不同的对象按照相似性聚集成不同的类别,从而使人们可以更加系统地研究各类事物的特征。WUM中的聚类分析主要有用户事务聚类和页面聚类。 用户事务聚类是分析各访问序列(会话、事务)之间的相似性,形成具有相似兴趣和特性的一组事务,其目标是试图找到具有共同兴趣的用户组,并将不同用户组的典型页面分别保存到相应类的数据库中,为客户分析及产品推荐服务。当访问者进入网站开始请求页面时,系统根据其对页面的请求很快判定该用户属于哪一用户组,从而可以将该类库中的典型页面予以推荐,以提高用户的访问效率。 主讲人:舒彤 博士 手机 Email * * 页面聚类是利用访问历史记录建立被访问页面之间的频度/概率模型,分析页面间的链接关系或逻辑关系,将最频繁被一起访问的页面聚成一类,类内各页面间的链接被频繁地相互点击,而类与类之间的链接则不常被点击,其目标是试图找到能实现用户访问目标的一组页面,为站点结构优化服务。 关联规则发现 关联规则(Association Rule)是发现数据之间的因果关系,并给出这种因果关系的性能评价,一般用信度和支持度衡量该规则的可信度。在WUM中,关联规则发现主要用于从用户访问序列数据库的访问序列中挖掘出相关的规则。例如“访问了X页面的访问者有90%的人同时也访问了Y页面”就是典型的关联规则。 最常用的关联规则发现算法是Apriori算法,可从事务数据库中挖掘出最大的频繁访问项集,这个项集就是关联规则挖掘出来的用户访问模式。 主讲人:舒彤 博士 手机 Email * * 序列模式发现 序列模式(Sequential Pattern)发现是指在时序数据集中发现数据之间的前后(因果顺序等)关系模式。用S=S1,…,Si,…,Sn表示一个序列,其中Si(1≤i≤n)为项集,将序列所包含的项集的数目定义为序列的长度。一个访问者的所有访问事务(一个会话)Ti按访问时间排序就形成一个用户序列。序列模式发现的任务就是发现各事务之间的关联关系。 序列模式发现与关联规则发现间的区别与联系:它们都是发现关联关系,但序列模式是发现不同会话之间页面的联系,而关联规则是分析一次会话内部的页面间的联系。在WUM里,发现序列模式能够便于组织预测用户的访问模式,对用户进行有针对性的广告服务,或在服务器方选取有针对性的页面,以满足访问者的特定要求。 序列模式的代表性算法有R.Agrawal和R.Srikant在1996年提出的GSP(Generalized Sequential Patterns)算法。 主讲人:舒彤 博士 手机 Email * * 其他WUM方法 分类(Classification)是识别并描述数据集中数据对象的特征,建立分类模型,然后将数据对象划分到不同的类中。通过分类,可以理解事物的特征并对未知实例的模式进行预测。聚类的目标是将已有的访问者聚集成几个不同的用户组,而分类的目标则是将一个未知的访问者划分到某个已知的用
文档评论(0)