- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
广西大学数学与信息科学学院
商务智能课程论文
题目:商务智能在大众点评中的应用
小组成员:1111200139 蓝承妙
1111200202 刘金香
摘要:大众点评是中国领先的本地生活信息及交易平台,也是全球最早建立的独立第三方消费点评网站,它不仅为网友提供商户信息、消费点评及消费优惠等信息服务,同时亦提供团购及餐厅预订等O2O(Online To Offline)交易服务。本文通过分类回归树分类回归树area)、具体地址(address)、联系电话(phone)、营业时间(hours)、平均物价(avg_price)、会员卡服务、大众对其产品的各类评价等级、环境、服务等级等数据项。
为了有效的使用该数据,本文运用分类回归树分类回归树CR?tree
分类回归树CR?tree,全称为the?classification?and?regression?tree是一种基于树的分类和预测方法,模型使用简单,易于理解(规则解释起来更简明易),该方法通过在每个步骤最大限度降低不纯洁度,使用递归分区来将训练记录分割为组。
通过分析数据中存在的预测因子变量,如店铺的环境等级、产品等级和服务等级等预测并分类,为新用户在选择是否光顾某家店铺提供决策依据。
2.3 数据
原始数据中包含的内容多而繁杂,为了方便研究,我们从中筛选了涉及店家评价的数据项very_good_remarks、good_remarks、common_remarks、bad_remarks、very_bad_remarks进行整理,将very_good_remarks、good_remarks、common_remarks这三个字段处理为积极评价,字段jiji的值为这三个字段的总和,视为对该店家的积极评价,将bad_remarks、very_bad_remarks这二个字段处理为消极评价,字段xiaoji的值为这二个字段的总和,为该店家的消极评价。新增字段hh取值为0和1,判定该店铺是否值得新客户选择,如果该店铺消极评价(xiaoji)的值小于总评价(jiji+xiaoji)的10%,则认为该店铺值得选择,hh的值为1;反之,为0该店铺值得选择。
将数据SPSS工作区域,再添加一个类型节点选择hh字段,将其type设为FlagDirection设为Out,如图1所示。Direction设为
图1 在类型节点中设置相关参数
在类型节点上连接一个CRT节点,设置其参数,选择简单模式(Simple Mode),如图2所示。
图2 Simple标签
运行CRT节点,出现交互式窗口,完全展开的决策树如图3所示。
图3 CRT决策树
2.4 分析决策树
从图3可以看到第一层的划分是根据product_rating,第二层的划分根据environment_rating,第三层service_rating。从节点1中,可以看出若大众对某店家product的综合评分在8.25分以上,那么该店家值得光顾;product的综合评分在8.25分以下,则可以参考其环境评分,若environment_rating大于6.75分,说明其环境优美,值得光顾;同理,若其环境评分低于6.75,则可参考其员工服务质量。从店铺角度也能通过该决策树以及其自身在大众点评网上的各项评分来做相应的调整,以提高自身的收益。
2.5 评估模型
根据创建当前决策树生成评估模型(Generate Model)hh1,工作区中将hh1与类型节点连接起来,在模型设置标签中选择“Calculate confidence”和“Rule identifier”,如图4所示。最后,连接一个数据表节点,并运行当前数据流,如图5所示。
图4 计算置信度与规则识别
图5 数据流示意图
运行后的数据表列出了那些有可能大众点评中总评价好的美食店家记录,如图6所示。$R-hh列的值表明预测结果,若其值为1,预测该店家值得新用户光顾。
图6 数据表
2.6 小结
通过整理原始数据中大众对1000家全国各地的店家的积极、消极评价,分析预测因子变量,例如avg_price、product_rating、environment_rating、service_rating,可以预测并分类1000家店铺是否值得光顾,并且能够为提高店家自身评价、收益做出决策。
三、关联规则分析
3.1 目的
根据大众点评网上提及的店铺提供的美食分类来研究各省份受欢迎的美食,从而可以得出该省份的饮食习惯。
3.2 数据整理
选取原始数据中的province、city、a
文档评论(0)