- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
柯政:教研中的数据挖掘_7152793_924834
教研中的数据挖掘技术 柯政 k.zheng@ 某学院的录取情况 申请人数 录取人数 录取率 男生 360 198 55% 女生 200 88 44% 申请人数 录取人数 录取率 男生 360 198 55% 女生 200 88 44% 学系A 申请人数 录取人数 录取率 男生 120 18 15% 女生 120 24 20% 学系B 申请人数 录取人数 录取率 男生 240 180 75% 女生 80 64 80% (Bickel,1975) 量化数据分析的基本结构 描述分析 单变量 多变量 推断统计 基于样本的数据对总体进行统计推断 内容提纲 单变量常用统计量及其应用 多变量关系分析及其应用 其他一些常用的方法 一、单变量分析 频率分布 集中趋势 离散趋势 标准分 频率分布 定义:各数据的总体分布情况 50分几个,比例多少;60分几个,比例多少 分析呈现方式 柱状图、铁饼图等 Excel中的筛选功能 检验正态分布 正态分布 偏态分布 集中趋势 平均数 中位数 离散趋势 指标 全距、四分位距 标准差、方差 离散趋势 指标 全距、四分位距 标准差、方差 方差、标准差的公式 离散趋势 指标 全距、四分位距 标准差、方差 几个常用数字 68%在正负1个SD间 95%在正负2个SD间(1.96) 标准分 原理和意义 计算方法 极值法=(原始分-最低分)/全距 Z分数法=(原始分-平均分)/标准差 改变了什么? 对一份卷子中某一类(道)题目的横向比较分析 二、多变量关系分析 两个变量 三个及以上变量 两个变量关系 一个数据是分类数据,一个是连续数据,用平均数比较(标准差) 两个数据都是分类数据,用双变量表 双变量表示例(一) 男 女 总计 好学校 78 30.5% 92 36.4% 170 一般学校 30 11.7% 49 19.4% 79 薄弱学校 148 57.8% 112 44.3% 260 总计 256 100% 253 100% 509 双变量表示例(二) 积极 一般 消极 总计 同事关系 教学质量 收入 管理制度 教学条件 办学理念 … 两个变量关系 一个数据是分类数据,一个是连续数据,用平均数比较(标准差) 两个数据都是分类数据,用双变量表 两个数据都是连续数据,用散点图 相关关系计算 直线还是曲线 直线相关 曲线相关 曲线相关 这是什么相关 两个变量关系 一个数据是分类数据,一个是连续数据,用平均数比较(标准差) 两个数据都是分类数据,用双变量表 两个数据都是连续数据,用散点图 相关关系计算 直线还是曲线 具体量化关系表达 三个及以上变量 回归分析 回归系数 比较重要性 三个及以上变量 回归分析 回归系数 比较重要性 应用:摸底试卷(校本题库)研制 三、其他常用数据分析方法 信度计算 推断统计 推断统计分析 推断统计的原理 显著性水平 易见错误
文档评论(0)