网站大量收购闲置独家精品文档,联系QQ:2885784924

基于关联规则的专业方向选择的设计分解.ppt

基于关联规则的专业方向选择的设计分解.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
论文的组织结构 开发背景 数据挖掘的概念 数据挖掘的常用方法 关联规则的基本原理 关联规则的算法 专业方向选择系统拟采用的开发平台 关联规则在选择专业方向中的应用 专业方向选择系统的实现 致谢 开发背景 近年来大学生的人数在不断递增,但是质量却在不断下降,其中就是因为没有选择好自己的专业,导致学不好,计算机专业方向有软件和硬件,为了让学生了解到自己适合选择哪个专业方向,我们可以对学生的各科成绩以及科目偏向的方向来进行分析,从大量的数据中找出其中有价值的规律,从而指导学生选择选择最适合自己的专业,这篇文章就是讨论与研究选择专业方向系统的实现。 毕业论文 题目:基于关联规则的专业方向选择的设计 学生姓名:朱春年 所在院系:计算机学院 专业:计算机科学与技术 届别:2015届 指导老师:王峻 数据挖掘的概念 数据挖掘,顾名思义就是通过对数据的分析发现一些未被人们所知道的信息,这些信具有某种隐藏的价值。从而帮助人们有效去利用这些潜在价值的数据的过程。它是一种信息处理技术,是从大量的数据中,从不同角度去不断抽取、不断转换、不断分析等处理,从中提取出能辅助各行业决策所需要的数据。它不仅是一个数据处理的过程,而且还是一个行业未来预测的过程。 数据挖掘常用的方法 数据挖掘主要用到的方法有六种,分别是描述统计,关联和相关,分类和聚变,预化,优化,结构与方程化。而不同的方法所用到的地方也是不同的,他们在不同的方面起到同样重要的作用。 关联规则的的基本原理 如果我们设项的集合M={m1,m2,...,mn},设集合N是数据库事务的集合,N中有任务相关的数据,设W是事务,则N中的每个W是项的非空集合,从而W?M。事务N都有自己的标识符,我们称WMN。设一个项集E,若E?W,则事务W就包含E。所以,我们就可以将满足E=F形式的蕴涵式描述为关联规则,其中E?M,F?M ,且E∩F=Φ且E,F都不为空。 关联规则的算法(续) 关联规则算法是用于数据发掘研究众多算法中的其中一种。完成关联规则数据挖掘就是在设定的支持度的最小值情况下,找出所有的满足这个值的频繁项集,根据找出的频繁项集,算出置信度,根据设定的置信度最小值,产生关联规则。我们可以它划分为以下步骤:一是找出数据集D中所有的频繁项目集,根据最小支持度。二是产生关联规则,根据频繁项集和最小置信度。 关联规则的算法(续) 关联规则的Apriori算法是基于递推思想,立足于两个阶段求频繁项集,主要思想如下: 第一步,扫描数据库,统计每一项发生的数目,根据给定的支持数,找出所有满足大于或等于给定支持数的项,获得频繁1项集,记作L1; 第二步,在找出L1后,从L1中找出后选频繁2项集,记作C2;重新扫描数据库,统计每一项发生的数目,找出所有满足大于或等于给定支持数的项,找出频繁2项集,记作L2; * 关联规则的算法(续) 第三步,按照第二步,以这种方式,找出频繁3项集,记作L3; 第四步,按照第三步,循环迭代,如果设我们要找最后频繁k项集,循环直到找不到频繁k+1项集。 * 专业方向选择系统拟采用的开发平台(续) 由于本系统的数据量可能会比较大,且考虑到该系统对安全性要求比较高,对此,我们选用SQL Server 2008作为数据库开发。SQL Server 2008是一种可以存储较大量数据的关系数据库,它在SQL Server 2005的基础上,通过扩展简单的数据加密技术、外键管理技术等提高了系统数据的安全性;它通过改进数据库的镜像、热添加cpu等措施确保了业务的可持续性。 专业方向选择系统拟采用的开发平台(续) 编程语言选择 php是一种通用开源脚本语言,主要适用于Web开发领域。它可以比CGI或者Perl更快速地执行动态网页。用PHP做出的动态页面与其他的编程语言相比,PHP是将程序嵌入到HTML文档中去执行,执行效率比完全生成HTML标记的CGI要高许多;PHP还可以执行编译后代码,编译可以达到加密和优化代码运行,使代码运行更快。 关联规则在选择专业方向中的应用(续) 原始数据 关联规则在选择专业方向中的应用(续) 根据以上收集到的数据,经过关联规则找出频繁项集,设最小支持数为10,计算置信度结果。 * 关联规则在选择专业方向中的应用(续) 关联规则在选择专业方向中的应用(续) 由以上数据分析可知,专业方

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

我是一名原创力文库的爱好者!从事自由职业!

1亿VIP精品文档

相关文档