- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
论文的组织结构 开发背景 数据挖掘的概念 数据挖掘的常用方法 关联规则的基本原理 关联规则的算法 专业方向选择系统拟采用的开发平台 关联规则在选择专业方向中的应用 专业方向选择系统的实现 致谢 开发背景 近年来大学生的人数在不断递增,但是质量却在不断下降,其中就是因为没有选择好自己的专业,导致学不好,计算机专业方向有软件和硬件,为了让学生了解到自己适合选择哪个专业方向,我们可以对学生的各科成绩以及科目偏向的方向来进行分析,从大量的数据中找出其中有价值的规律,从而指导学生选择选择最适合自己的专业,这篇文章就是讨论与研究选择专业方向系统的实现。 毕业论文题目:基于关联规则的专业方向选择的设计 学生姓名:朱春年 所在院系:计算机学院 专业:计算机科学与技术 届别:2015届 指导老师:王峻 数据挖掘的概念 数据挖掘,顾名思义就是通过对数据的分析发现一些未被人们所知道的信息,这些信具有某种隐藏的价值。从而帮助人们有效去利用这些潜在价值的数据的过程。它是一种信息处理技术,是从大量的数据中,从不同角度去不断抽取、不断转换、不断分析等处理,从中提取出能辅助各行业决策所需要的数据。它不仅是一个数据处理的过程,而且还是一个行业未来预测的过程。 数据挖掘常用的方法 数据挖掘主要用到的方法有六种,分别是描述统计,关联和相关,分类和聚变,预化,优化,结构与方程化。而不同的方法所用到的地方也是不同的,他们在不同的方面起到同样重要的作用。 关联规则的的基本原理 如果我们设项的集合M={m1,m2,...,mn},设集合N是数据库事务的集合,N中有任务相关的数据,设W是事务,则N中的每个W是项的非空集合,从而W?M。事务N都有自己的标识符,我们称WMN。设一个项集E,若E?W,则事务W就包含E。所以,我们就可以将满足E=F形式的蕴涵式描述为关联规则,其中E?M,F?M ,且E∩F=Φ且E,F都不为空。 关联规则的算法(续) 关联规则算法是用于数据发掘研究众多算法中的其中一种。完成关联规则数据挖掘就是在设定的支持度的最小值情况下,找出所有的满足这个值的频繁项集,根据找出的频繁项集,算出置信度,根据设定的置信度最小值,产生关联规则。我们可以它划分为以下步骤:一是找出数据集D中所有的频繁项目集,根据最小支持度。二是产生关联规则,根据频繁项集和最小置信度。 关联规则的算法(续) 关联规则的Apriori算法是基于递推思想,立足于两个阶段求频繁项集,主要思想如下: 第一步,扫描数据库,统计每一项发生的数目,根据给定的支持数,找出所有满足大于或等于给定支持数的项,获得频繁1项集,记作L1; 第二步,在找出L1后,从L1中找出后选频繁2项集,记作C2;重新扫描数据库,统计每一项发生的数目,找出所有满足大于或等于给定支持数的项,找出频繁2项集,记作L2; * 关联规则的算法(续) 第三步,按照第二步,以这种方式,找出频繁3项集,记作L3; 第四步,按照第三步,循环迭代,如果设我们要找最后频繁k项集,循环直到找不到频繁k+1项集。 * 专业方向选择系统拟采用的开发平台(续) 由于本系统的数据量可能会比较大,且考虑到该系统对安全性要求比较高,对此,我们选用SQL Server 2008作为数据库开发。SQL Server 2008是一种可以存储较大量数据的关系数据库,它在SQL Server 2005的基础上,通过扩展简单的数据加密技术、外键管理技术等提高了系统数据的安全性;它通过改进数据库的镜像、热添加cpu等措施确保了业务的可持续性。 专业方向选择系统拟采用的开发平台(续) 编程语言选择 php是一种通用开源脚本语言,主要适用于Web开发领域。它可以比CGI或者Perl更快速地执行动态网页。用PHP做出的动态页面与其他的编程语言相比,PHP是将程序嵌入到HTML文档中去执行,执行效率比完全生成HTML标记的CGI要高许多;PHP还可以执行编译后代码,编译可以达到加密和优化代码运行,使代码运行更快。 关联规则在选择专业方向中的应用(续) 原始数据 关联规则在选择专业方向中的应用(续) 根据以上收集到的数据,经过关联规则找出频繁项集,设最小支持数为10,计算置信度结果。 * 关联规则在选择专业方向中的应用(续) 关联规则在选择专业方向中的应用(续) 由以上数据分析可知,专业方
您可能关注的文档
- 电力系统谐波检测和系统的设计分解.doc
- 电力系统灾害预防分解.doc
- 化学药剂MSDS分解.ppt
- 《大高考》2016届高考复习数学理(全国通用):第十章计数原理、概率与统计第六节素材.ppt
- 精密超精密加工技术分解.ppt
- 《大高考》2016届高考复习数学理(全国通用):第十章计数原理、概率与统计第三节素材.ppt
- 基因工程的基本操作分解.ppt
- 《大高考》2016届高考复习数学理(全国通用):第十章计数原理、概率与统计第四节素材.ppt
- 电力线路基础知识分解.doc
- 精密机械设计复习分解.ppt
- 中国游戏出海行业简析报告 2024.docx
- 2025AI产业全景报告.pdf.docx
- 2024年度上市公司刑事犯罪报告.docx
- 新春看消费之汽车板块:市值跌宕与业绩荣枯间,书写国产汽车的奋斗篇章.docx
- 农小蜂-全国农产品批发市场价格行情监测周报(2024年第53周).docx
- 保险行业:浅析商业保理公司在资产证券化业务中的作用及相关风险缓释措施 20250115 -联合资信.docx
- 2025年人力资源趋势.docx
- 城投债季度报告:化债攻坚,转型可期-基础设施投融资行业2024年度政策回顾及展望 20250113 -中诚信.docx
- EqualOcean 2023中国品牌全球化服务新趋势报告.docx
- 睡眠医学中心:精准医疗,引领健康睡眠未来趋势 头豹词条报告系列.docx
文档评论(0)