网站大量收购独家精品文档,联系QQ:2885784924

开题报告(v1.0)—基于关联规则的成绩分析系统设计与实现.doc

开题报告(v1.0)—基于关联规则的成绩分析系统设计与实现.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
开题报告(v1.0)—基于关联规则的成绩分析系统设计与实现

山 东 科 技 大 学 本科毕业设计(论文)开题报告 题 目 基于关联规则的成绩分析系统设计与实现 学 院 名 称 信息科学与工程学院 专业班级 软件工程2011级2班 学生姓名 柳汝滕 学 号 201101051718 指导教师 倪维健 填表时间:二○一五年四月六日 设计(论文) 题目 基于关联规则的成绩分析系统设计与实现 设计(论文) 类型(划“√”) 工程设计 应用研究 开发研究 基础研究 其它 √ 一、本课题的研究目的和意义 数据挖掘是指以某种方式分析数据源,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识发现,而关联规则挖掘则是数据挖掘中的一个很重要的课题,顾名思义,它是从数据背后发现事物之间可能存在的关联或者联系。 本课题主要目的是通过研究Apriori算法和信息熵理论,研究关联规则在学生成绩分析方面的应用。传统的Apriori算法在生成频繁项集和关联规则方面存在着诸多缺陷。本课题针对Apriori算法进行一定程度的改进,使得更加有利于应用于成绩分析。将该算法集成到学生管理平台下,通过对不同课程的成绩数据进行挖掘,比找出不同课程之间可能存在的关联,了解学生课程成绩之间的关系,比如:A同学的a课程得分属于优秀,同时该学生的b课程得分也属于优秀,是否可以推断a课程优秀的同学b课程相应的也多数为优秀。通过类似的分析利于院系调节相关课程的设置,使得课程的安排更加合理,通过分析课程的关联,安排课程学习的先后顺序,辅助教学管理。同时该算法可以对课程成绩的评比是否合理提供一定的参考意见。 数据挖掘中关联规则的分析并不局限于成绩分析,在很多领域有着广泛的应用于发展潜力,是一门具有广阔前景的数据处理与分析技术,它将在有大量信息的教育领域中发挥不可估量的作用。 二、本课题的主要研究内容(提纲) 本课题主要目的是通过研究Apriori算法和信息熵理论,研究关联规则在学生成绩分析方面的应用。 1、关联规则分析: 关联规则分析的步骤: (1)从事务集合中找出频繁项目集; (2)从频繁项目集合中生成满足最低置信度的关联规则。 2、Apriori算法: (1)传统的Apriori算法: 传统的Apriori算法在生成关联规则方面利用了向下封闭属性:如果一个项集是频繁项目集,那么它的非空子集必定是频繁项目集。它先生成1-频繁项目集,再利用1-频繁项目集生成2-频繁项目集,然后根据2-频繁项目集生成3-频繁项目集,依次类推,直至生成所有的频繁项目集,然后从频繁项目集中找出符合条件的关联规则。 (2)改进的Apriori算法: 由于传统的Apriori算法的某些特性,使得算法存在着一定程度的改进,使得关联规则的生成速度更加迅速。 3、信息熵: Apriori算法在生成频繁项集方面具有一定的优势,是一个比较优秀的算法。但是在关联规则的生成方面存在一定的偶然性,很容易受到部分偶然数据的影响造成分析的结果与实际情况无法很好的吻合,所以对Apriori在生成关联规则方面不再使用简单的p(B|A)=P(AB)/P(A)来作为置信度来判断。 不妨把信息熵理解成某种特定信息的出现概率,某一信息出现与否是不确定的,衡量它的标准是根据其出现的概率来度量。概率大,出现机会多,不确定性小;反之就大。不确定性函数f是概率P的单调递降函数;两个独立符号所产生的不确定性应等于各自不确定性之和,即f(P1,P2)=f(P1)+f(P2),这称为可加性。同时满足这两个条件的函数f是对数函数,即f(P) = log(1/p)。 三、文献综述(国内外研究情况及其发展) 关联规则挖掘是数据挖掘研究领域中的一个重要分支,最近几年已成为数据挖掘领域一个重要的研究方向,而Apriori算法是关联规则挖掘中的经典算法,Apriori算法的改进也是一个热门研究点,并取得了一定的成果。 1948年,香农提出了“信息熵”的概念,解决了对信息的量化度量问题。从那之后信息熵就广泛的应用于电子信息、决策分析、图像处理、农业科技研究等广泛的领域,并获得很好的实际应用效果。 1、国外研究现状 1993年,美国著名学者R.Agrawal等人首次提出了关联规则挖掘问题,之后提出了基于频繁项集的著名Apriori算法。Apriori算法是数据挖掘中关联规则的最典型最核心最基本的算法。目前,国外对此算法的改进有:Pard基于散列技术的改进,Savasere基于划分的改进,Toivonen基于采样的改进,J.Han和Y.Fu基于事务压缩的改进,等等,有效的改善了Apriori算法的效率低下问题。 2、国内研究现状 目前,国内在Apriori算法应用方面

文档评论(0)

jiqinyu2015 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档