- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
教育统计学期末复习1.统计学分为数理统计学和应用统计学,教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。描述性统计和推断性统计(估计和假设检验)2.随机现象的每一种结果叫做一个随机事件,能表示随机现象各种结果的变量称为随机变量,统计处理的变量都是随机变量。第二章 数据的初步整理一、数据的来源、种类及其统计分类(一)来源1.经常性资料:文字记载的资料2.专题性资料①教育调查:在没有预定因子、不施行控制的条件下,对现成的教育方面有关客观事实所进行的观察和分析。分为:现情调查、回顾调查和追踪调查或全面调查和非全面调查②教育实验:在预定的控制因子影响下,对教育方面有关客观事实所进行的观察和分析。一般设立两种实验处理进行对照和比较:单组实验(看两种形式对结果的影响)、等组实验(甲乙两组基本条件相同的情况下,对之施行不同的实验处理)和轮组实验(在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次:甲组实验先A后B,重复为先B后A;乙组实验先B后A,重复先A后B)(二)种类1.变量定类(称名)变量:如性别、专业定序(顺序)变量(无相等单位和绝对零点):1级、2级、三级定距(等距)变量(有相等单位无绝对零点):摄氏温度定比(比率)变量(有相等单位有绝对零点):身高、体重2.数据①点计:人数、物品个数。度量:用工具得到的数据②间断型随机变量数据(类别数据,人数、等级),连续型随机变量数据(数据可以用小数表示,连续区间)3.统计量与参数(统计量:在统计工作中,对一系列原始数据进行计算,得出的平均数,标准差)参数(由样本估计总体的水平)二、统计图表1.统计表一般由标题、表号、题目、线段、数字(暂缺或未记录…表示,无用—表示)、表注构成表2.1 某年级各班学生人数班别一班二班总和人数423678表2.8 38名学生6道选择题做对的频数分布做对题数0123456总和频2.11 二年级80个学生身高的频数、累积频数、累积百分比分布表身高组中值频数累积频数累积百分比115-118-121-124-127-130-133-136-139-142-116.5119.5122.5125.5128.5131.5134.5137.5140.5143.5138102019124211412224261737779801.255.0015.0027.5052.5076.2591.2596.2598.75100.00总和80表2.12 师大附小和云岭小学二年级学生身高的频数百分比分布表身高频数频数百分比师大附小云岭小学师大附小云岭小学112-115-1161.252.5015.00总和8040100.00100.002.统计图标题、图号、标目、图形、图注表示间断变量:直条图(纵条图和横条图)、圆形图表示连续变量:线形图、频数分布图(直方、多边、累积频数和累积百分比图)三、抽样为了使统计推断正确可靠,就应当使样本对于总体有较好的代表性,这就引伸出抽样的问题:抽样方法:单纯随机抽样:抽签,等概率,一般来说要放回,但无限总体放回与不放回不改变机械抽样:从总体中抽取样本时,按照时间或空间的等距间隔抽取,可与单纯随机抽样结合起来(前20人中选任一个,再从下一个20人中任选一个)分层抽样:分组后单纯随机抽样整群抽样:如要调查北京市五年级小学生患近视眼的情况,不是个别地抽取每个学生,而是按照学校来抽样,然后对抽取到的学校中的每个五年级小学生进行检查。组织便利容易抽取,缺点是样本单位在总体中的分布不均匀,代表性有限。样本容量:一般认为n30为小样本,n≥30为大样本第三四章 集中量和差异量集中量:用一个数据表示总体(或样本)某一方面的一般水平算术平均数()及加权平均数()频数分布表计算法中,把X替换为fx(组中值)X频数中位数(Md)频数分布表计算法:类似四分位距计算法众数(Mo)皮尔逊经验法:Mo≈3Md - 2(四)算术平均数、中位数和众数的关系当频数分布呈正态时,算数平均数、中位数、众数三者重合为一点。中位数始终在中间,正负偏态看二、差异量:一组数据离散程度(一)绝对差异量1.四分位距(QD):数量中间的50%Q1(累积频数为25%)Q3(累积频数为75%)(1)原始数据求法(2)频数分布表求法(内插法)分数频数累积频数四分位距50-11Q3=85+X5=88.555-2360-3665-41070-51575-62180-82985-103990-54495-448总和48平均差(MD)各数与算术平均数或中数之绝对利差的平均数:3.方差(2)和标准差()(1).原始数据法(2).频数分布表法:把X换成组中值fx(二)相对差异量:两种单位不同,身高体重CV大,表明离散程度大,CV小,表明离散程度小(三)偏态量和峰态量1.偏态量SK=
文档评论(0)