数据仓库与数据挖掘课程设计.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘课程设计

《数据仓库与数据挖掘》 课程设计报告 班 级: 信管091 学 号: 3090561012 姓 名: 李国祥 指导教师: 王建仁/段刚龙 日 期: 2011.12 高校选修课关联分析 1需求分析与数据理解 1.1需求分析 在当前的大学教育中,教育体制正趋向于人性化与科学化,越来越多的高校都采取学分制作为最主要的教学方式,为学生们开设了各种选修课供不同专业的学生选择。学生在选修课程时,根据其自身的兴趣爱好及专业要求,也有不同的选择,且在选择课程时,对一些相关的课程表现出关联性,本次高校选修课关联分析利用数据挖掘技术,通过分析学生选课时的关联性,希望从学生的选课信息中找出选修热度高的课程,并提取出关联规则,找出相关程度高的课程,以供高校在为学生安排选修课时做出决策支持。 1.2 数据理解 本次关联分析主要需要的信息为学生的选课信息,即每个学生所选择的课程。通过从选课信息中提取频繁项集与关联规则,得出结果。 2挖掘数据准备 本次分析主要采用西安理工大学经济与管理学院部分学生的选修课结果为源数据,且选取具有代表性的数据,在此数据的基础上分析关联规则。 需要挖掘的数据为选课信息,主要涉及到两个表目。 学生信息:学号,姓名,班级,学院 (主键为:学号) 选课信息:学号,课程,任课教师,上课时间 (主键为:学号、课程,外键学号参照学生信息表的学号项) 主要数据如下: 3 数据挖掘过程 3.1挖掘算法与挖掘软件选择 数据挖掘所采用的软件为Microsoft SQL Server Business Intelligence Development Studio。 采用的算法为Microsoft 关联规则算法。该算法生成的规则描述哪些项最有可能在事务中出现在一起。借助这些规则,可以根据其他项在事务中的出现情况,来预测某一项的出现情况。 3.2 数据预处理 数据与处理的最主要工作为属性值的统一,使表之间相关联的属性的数据类型一致,满足以下约束: 3.3挖掘过程说明 (1)在Microsoft SQL Server Business Intelligence Development Studio 中创建一个名称为“选修课关联分析”的项目,并定义数据源、定义数据源视图。 (2)在已定义的数据源视图基础上,创建“选修课关联分析”关联挖掘结构。并选择挖掘技术为Microsoft 关联规则算法。 (3)设置数据挖掘向导中的指定项。指定事例表为学生信息,嵌套表为选课信息,以及定型数据。 (4)完成挖掘结构的建立。并部署选修课关联分析项目。 4 结果展示与评价 (1)设置算法参数。将项集中允许的最大项数设为1,同时指定包含该项集的最小事例数为3,查看单项课程中,选修率比较高的课程。 结果显示,以上课程被选修的热度比较高,对于这些课程,学校在作出决策时可以考虑适当地增加开班数目,以尽可能的满足更多学生的需求。 (2)调整最小项集为2,提取出所有的相关课程。 (2)调整最低支持度为2,从上面已抽取的相关课程项集中,提取出频繁项集,已找出同时被选修可能性大的课程。 结果显示,以上课程被同时选修的概率较大,学校在安排选修课时,可以考虑将这些相关课程的上课时间错开处理,这样可以让学生们根据其需要同时选修,减少学生选课时的冲突现象。比如将“经济法”与“物流经济学”上课时间错开。 (3)查看所有具有关联性的课程的置信度及其概率。 (4)在上一步的基础上,调整置信度为0.68,查看关联规则比较大的项集。 结果显示,以上课程具有比较大的关联度,学校在作出决策时,需考虑它们的关联性,在开设某一门选修课之前,先开设其基础课程,以便于学生打好基础。比如在开设“高级财务会计”之前,先开设“初级财务会计”课程。 (5)调整置信度为100%,查看结果。 该结果表明“JAVA程序设计”与“网站开发与管理”这两门课具有绝对的关联性,这时学校可以考虑将两门课程合并为一门课程,以便于学生更好地掌握课程所要教授的技术。 (6)查看依赖关系网络。 在依赖关系网络图中,通过选择某一个节点,可以查看其双向预测节点、预测它的节点以及该节点所预测的节点,利用网络图的形式可以更明确地查看课程之间的规则及依赖关系。 比如:选定国际贸易课程时,可以看到世界经济概论与贸易英语是预测它的节点,这就为学校做出选修课安排决策时提供了明了的参考信息,根据关系做出合理的时间安排,即课程的“先开与后开”问题。 5总结 5.1 设计中遇到的主要问题及解决方法 (1)在设计学生信息管理,来访登记和新生注册界面时,如果每建一个控件都分别设置使其与需要数据表的字段绑定,太过繁杂。可以在表单处先单击鼠标右键,在弹

您可能关注的文档

文档评论(0)

woai118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档