《数据挖掘与统计应用》课程教学大纲.docx

《数据挖掘与统计应用》课程教学大纲.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《数据挖掘与统计应用》教学大纲

课程编号:121063A

课程类型:□通识教育必修课□通识教育选修课

□学科基础课□专业核心课

?专业提升课□专业拓展课

总学时:48讲课学时:32实验(上机)学时:16

学分:3

考试类型:?考试?考查

适用对象:经济统计学统计学数学与应用数学(金融方向)专业

□是?否适合作为其他专业学生的个性化选修课

先修课程:统计学、计算机基础

一、教学目标

该课程是针对统计学院所有专业本科学生开设的,其特点是不以数学理论和推导为主,而是在学生了解数据挖掘的基本概念和基本理论的基础上,介绍典型数据挖掘方法的基本思路和算法,教会学生能够利用数据挖掘软件分析实际数据。本课程主要以国际通用权威数据挖掘软件为主要教学工具,以实际工作中的数据进行实训教学。达到的教学目标是:增强学生实际动手解决问题的能力,学会利用数据挖掘软件处理实际数据。

目标1:应用专业知识,解决数据分析问题

目标2:可以建立统计模型,获得有效结论

目标3:掌握统计软件及常用数据库工具的使用

目标4:关注国际统计应用的新进展

目标5:基于数据结论,提出决策咨询建议

目标6:具有不断学习的意识

目标7:培育有坚定理想信念、深厚爱国主义情怀、高尚道德情操,具有扎实统计专业学识,坚韧奋斗进取品格的社会主义新青年。

二、教学内容及其与毕业要求的对应关系

本课程重点讲授常用数据挖掘算法,包含联机数据分析与数据仓库、数据预处理、探索性数据分析、变量选择以及关联、聚类、分类、异常值侦测、时序等经典数据挖掘算法。其理论部分只介绍这些方法的基本思路与算法,授课的重点在于每一种挖掘算法,包括:每种算法的基本思路、应用前提、算法评判标准、软件的实现及输出结果的理解和解释,并能给出结论;介绍数据挖掘软件的应用,主要以一种数据挖掘软件并结合实际数据进行分析。以多媒体的课件讲授为主,同时上机,上机完成每种方法的练习。采用课堂练习和课后作业方式对学生掌握知识情况进行考核,建议采用开卷或论文方式进行课程考核,本课程平时成绩占30%,期末考试成绩占30%。

三、各教学环节学时分配

以表格方式表现各章节的学时分配,表格如下:

教学课时分配

序号

章节内容

讲课

实验

其他

合计

1

数据探索与预处理

4

2

?

6

2

模型结果评估

6

1

?

7

3

决策树

4

1

?

5

4

关联规则

6

1

?

7

5

聚类分析

3

1

?

4

6

Logistic回归

3

1

?

4

7

神经网络

4

1

?

5

8

数据挖掘软件介绍(SASEM)

6

4

?

10

合计

36

12

0

48

四、教学内容

第1章 数据探索与预处理

1.1 数据范围和分布标准化(了解)

1.2 数据可视化(了解)

1.3 缺失值插补(理解与掌握)

1.4 属性变量的处理(掌握)

1.5 变量的筛选(掌握)

课程思政切入点:通过探索数据,培养学生的探索精神。

第2章 模型结果评估

2.1 概述(了解)

2.2 分类规则评估面面观(理解)

2.3 误分率(掌握)

2.4 收益矩阵(掌握)

2.5 评估两分类的规则(掌握和应用)

2.6 评估多分类的规则(掌握和应用)

2.7 常用模型评估和比较准则(应用)

课程思政切入点:通过对错误分类细分中的两类错误分析,培养学生平衡对立矛盾的思想。

第3章 决策树

3.1 树的建模过程(理解)

3.2 树的常用算法(掌握)

3.3 树在数据挖掘中的应用(应用)

3.4 决策树案例分析(应用)

课程思政切入点:通过决策树的讲解,可以使学生进一步了解人类大脑进行决策的步骤。

第4章 关联规则

4.1 概述(了解)

4.2 市场购物篮分析(理解)

4.3 使用关联规则节点(了解)

4.4 理解关联规则(理解)

4.5 非二元变量的关联分析(掌握)

4.6 负关联分析 (掌握)

4.7 序列关联分析(理解)

4.8 关联规则案例分析(应用)

课程思政切入点:通过关联规则的学习,培养学生用联系的观点看待各种问题。

第5章 聚类分析

5.1 背景(了解)

5.2 距离度量(理解)

5.3 聚类方法(掌握)

5.4 变量聚类(理解)

5.5 实践中的考虑(了解)

5.6 聚类案例分析(应用)

课程思政切入点:通过聚类分析中差异度的讲解,培养学生对事物间差异进行度量的能力。

第6章 Logistic回归

6.1 传统Logistic回归简介(了解)

6.2 数据挖掘中Logit判别的其他考虑(了解)

6.3 logistic回归案例分析(掌握与应用)

课程思政切入点:通过对Logistic回归中风险最小化的分析,培养学生在实际工作学习和生活中管控风险的能力。

第7章 神经网络

7.1

文档评论(0)

CUP2008013124 + 关注
实名认证
内容提供者

北京教育部直属高校教师,具有十余年工作经验,长期从事教学、科研相关工作,熟悉高校教育教学规律,注重成果积累

1亿VIP精品文档

相关文档