电影评分关联因素分析报告2222.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实用标准文案 精彩文档 电影评分关联因素分析 ——《商业智能方法与应用》课程报告 目录 TOC \o 1-3 \h \z \u HYPERLINK \l _Toc415678256 一.问题分析 PAGEREF _Toc415678256 \h 1 HYPERLINK \l _Toc415678257 二.数据来源 PAGEREF _Toc415678257 \h 1 HYPERLINK \l _Toc415678258 1)首先在MetaStudio里解析网页结构 PAGEREF _Toc415678258 \h 2 HYPERLINK \l _Toc415678259 2) 通过DataScraper提取数据 PAGEREF _Toc415678259 \h 7 HYPERLINK \l _Toc415678260 三.使用工具 PAGEREF _Toc415678260 \h 8 HYPERLINK \l _Toc415678261 四.思路方法 PAGEREF _Toc415678261 \h 8 HYPERLINK \l _Toc415678262 五.结果分析 PAGEREF _Toc415678262 \h 10 HYPERLINK \l _Toc415678263 六.小组成员 PAGEREF _Toc415678263 \h 11 一.问题分析 电影是现代艺术中很重要的一个元素,同时也牵连很大的经济元素,除此之外,电影也是我们大学生活中很重要的娱乐方式。所以我们也就选择了电影作为我们研究性学习的题目,我们这次的研究性学习主要研究电影评分的影响因素,研究中观影的评价和评分我们主要锁定在豆瓣网,这样也就增加了研究的针对性。 二.数据来源 MetaSeeker分为MetaStudio和DataScraper两个工具包,只能在火狐浏览器里在线使用. 1)首先在MetaStudio里解析网页结构 2、在地址栏输入要解析的网址 结果为: 3、在工作台输入你定义的主题和要抓取的信息属性 4、通过点击网页电影名的位置获取结点,并把此节点的文本内容映射到电影名里 5、同理可以获得导演、主演、类型和评分的信息 6、通过定位 后页 作为线索继续抓取数据 7、在输出信息里可以看到抓取的信息 2) 通过DataScraper提取数据 1、数据情况 2、在本机里就可以得到提取的数据文件 3、整理数据文件 三.使用工具 数据挖掘工具的使用:WEKA、KNIME、Splunk、SPSS Clementine等。 四.思路方法 1、整理后发现导演和主演都太过分散,没有意义,所以对影片类型进行分析。 2、得到这样的布尔矩阵形式 3、在spss里利用apriori算法建立这样的模型进行关联分析 4、把不属于T/F格式的字段过滤掉 5、得到干净数据矩阵 6、生成结果——剧情类电影会更受欢迎 五.结果分析 网状图也清晰地表明了剧情类电影更受好评。 六.小组成员 胡雨灿 肖钰田 乔 梓

文档评论(0)

dmz158 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档