- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《数据挖掘技术在大型零售书店的若干应用》 《基于WEB数据挖掘技术的书店电子商务系统的设计与实现》 《基于分群模型的读者个性化服务研究》 《关联规则挖掘算法及其在个性化网站中的应用研究》 《决策树技术在网上书店系统中的应用》 * 图书: ——分类(根据中国图书馆分类法的学科分类来定义); ——属性; ——供货商; ——客户资料; ——书店内部组织机构及其系统维护。 面向销售的数据立方体(通过该模型可对销售数据进行购物篮分析): 面向销售和进货的数据立方体: 图书资料表: ——图书书号; ——书名; ——定价; ——图书类别id; 图书类别表: ——图书类别id; ——类别名; 销售事实表: ——销售编号; ——销售时间; ——POS机编号; ——店铺id; ——图书书号; ——销售数量; ——销售码洋; 日销售表: ——销售日期; ——店铺id; ——图书书号; ——销售数量; ——销售码洋; 购物篮分析: ——交叉销售; 图书销售表: ——图书ID,时间ID,会员ID,销售数量,价格。 多维数据集: 客户细分: ——将一个大的客户群体划分成一个个小的客户类别; 同类客户: ——拥有相似属性; 异类客户: ——拥有不同属性。 客户数据has三种类型: 1、客户基本特征数据; 2、企业促销活动数据; 3、企业交易数据。 一对一营销思想: 要求——书店能够了解每个客户的爱好、需求,针对客户的个人特点营销不同类型的书籍,和客户建立起长久稳定的关系。 可用分类和聚类来实现——提取“客户身份背景、购买能力、购买心理”相关信息。 客户保持及流失分析: ——根据对客户信息和营销数据的分析,找出哪些原因导致客户离开并且针对其原因挽回那些有意离开的客户。 ——财务原因/非财务原因; ——主动流失/被动流失。 抽取能够反映客户个人身份的背景、学历等方面的信息以及反映其交易心理的相关信息。 图书促销分析: ——购买趋势、热销图书、降价图书、补货图书…. Eg:女性时尚类=少儿类图书 for母亲们 有一些对促销没有作出反应的客户,处理方法: ——直接认为这些客户拒绝促销; ——把这些客户从分析中排除。 2 准备数据 具体流程: ——确定数据来源为:某财经类高校图书馆近3年读者借阅数据、图书信息数据、图书信息调整记录、图书馆管理系统升级记录、近3年放假日期、学生院系明细; ——数据范围:36个月; ——数据源:学校图书馆系统数据库; ——导出格式:Access2000; 建立4张表: ——借还书总表/图书总表/还书表/新书表; 借还书表的关键字段: ——正题名、索取号、读者证号、控制号、条形码、借出日期、应还日期、限还时刻、时还时刻、借还标识、续借次数、读者姓名、操作员。 在检查以上数据的基础上,构建用于分析的读者信息数据宽表,主要包括: ——读者属性类数据; ——读者行为类数据; ——读者价值类数据; ——读者交换类数据; 以下是各部分的主要变量: ——读者属性类数据:eg:读者编码、读者服务状态、读者学历、读者喜好、读者所属学院、所属专业、读者状态、创建时间; ——读者借阅类数据:eg:理工类、财经类、电脑类、文艺类、外语类、推荐图书类、论文类、电子图书类、各类图书借阅个数、续借次数; ——读者行为类数据:包括用户详细的行为信息:各类图书借阅的总天数、总次数,非工作日借书次数、寒暑假借书次数,不按时还书次数、最长欠费时长、最大欠费额度等; 三、关联规则分析在web个性化网站中的应用 Eg:一个简单的模拟电子商务系统 3.1 电子商务网站数据挖掘 主要数据: ——客户的背景信息:主要来自于客户的登记表; ——浏览者的点击流(click-stream):主要用于考查客户的行为表现。 分析和建立模型的技术和算法: ——网站的数据挖掘与原来的数据挖掘差别并不大,很多方法和思想都可以运用; ——不同的是网站的数据格式有很大一部分来自于点击流,与传统的数据库格式有区别; ——因而对电子商务网站进行数据挖掘所做的主要工作是:数据准备; ——应将网站的用户点击序列保存在文本文件中,以用户ID为唯一不重复的文件名,并利用Apriori算法的代码将其封装在ActiveX控件中,这样有利于软件复用,并可在多种开发环境(包括ASP)中调用; PS:if将用户点击序列保存在DB中,不仅会给DB增加额外的空间,造成表格设计的复杂性,而且会使挖掘程序本身与网站代码和DB系统的版本和设计耦合,不利于软件复用。 ——客户是商家争夺的焦点; ——通过决策树技术得到客户进行分析,发现客户所处的生命周期,针对处于不同客户生命周期的客户,采取个性化的策略; ——可实现向其推荐书籍和客户保持,提高客户满意度,进而建立忠诚度,防止客户流失; ——主要介绍ID3算法在网上
您可能关注的文档
- 宝安大厦营销策划方案.ppt
- 宝宝加分代理商市场营销方案.ppt
- 宝宝成长类APP分析.pptx
- 宝宝每月辅食计划大全.pptx
- 宝洁中国促销策略.ppt
- 宝水高速公路初设部审汇报幻灯new.ppt
- 宝洁公司财务报表分析(刘尧峰邓梦颜欢艾真言).ppt
- 宝洁市场营销案例分析.ppt
- 宝石倍显微镜.ppt
- 宝石琢型设计原理.ppt
- 国开(中央电大)专科《财务管理》网上形考(任务一至四)试题及答案完整版721441024.pdf
- 高中物理第七章机械能守恒定律第10节能量守恒定律与能源教案2新人教版.pdf
- 国家开放大学电大《可编程控制器应用》机考5套真题题库及答案4.pdf
- 高中历史第一单元政治制度第4课中国历代变法和改革课后训练含解析.pdf
- 国开电大中级财务会计(一)第一、二、三、四次形考任务答案 完整版完整版721440940.pdf
- 高中物理 第4章 3 势能教案 教科版必修2-教科版高一必修2物理教案.pdf
- 在全区未成年人思想道德建设暨对外宣传工作会议上的讲话 .pdf
- 高质量发展在集团下半年经济工作会议上的讲话 .pdf
- 高中物理必修二电子课本 .pdf
- 高中物理第六章万有引力与航天第2节太阳与行星间的引力教案新人教版必完整版722733413.pdf
最近下载
- 江苏开放大学行政伦理学综合大作业.doc
- 政治选择性必修2一民事权利与义务.docx
- 启迪幼儿园防汛安全演练方案.doc VIP
- 学校安全工作台账(最完整版).doc VIP
- 第11课 整理信息资源 教案 义务教育人教版信息科技三年级全一册.pdf
- 4.3.2等比数列的前n项和公式(教案)-高中数学人教A版(2019)选择性必修第二册.docx
- 八上必读名著《昆虫记》《红星照耀中国》复习资料.doc VIP
- CQC1143-2019电力储能系统用电池连接电缆认证技术规范.pdf VIP
- 铁路机车车辆驾驶人员(J6类)考前通关必练题及答案.doc VIP
- 幼儿园小班科学活动《小动物找尾巴》课件.pptx
文档评论(0)