- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学复习纲要(首经贸)
统计学复习纲要——2012~2013第一学期
基本概念
第一章:导论
1.统计学的研究对象:数据
2.)、抽样边际误差。
非抽样误差:抽样框误差、回答误差、无回答误差、调查员误差、测量误差
第三章:数据的图表展示
分类数据:频数、比例、百分比、比率;条形图、饼图。
顺序数据:累积频数、累积频率;环形图。
数值型数据:分组;直方图、折线图
分组:单变量分组、组距式分组(等距、异距)
上限、下限、组中值、开口组、闭口组
分组原则:不重不漏。
上组限不包括在组内
开口组的组中值:用相邻组的组距作为该组的假定组距,进而确定组中值。
组中值代表本组的一般水平,假定条件:本组数据分布均匀。
未分组数据:茎叶图、箱线图
时间序列数据:线图(趋势图)
多变量数据:雷达图
第四章:数据的统计量描述
1.集中趋势和离散程度
集中趋势说明数据集中的位置,也称为位置统计量,是数据的重心,代表数据的一般水平。一般用算术平均数(均值)表示。
离散程度是指数据间的分散程度,也称为位置统计量,说明数据间的距离,一般用方差或标准差表示。
离散程度越大,说明数据越分散,平均数的代表程度就越低,数据的稳定性就越差,或者说数据的波动性越强。反之亦然。
2.权数:也称权重,可以是绝对数(如人数、单位数等),可以是相对数(比重、频率)。本质上是概率,是各组权数占总权数的比重。说明各组变量值对总平均数的影响大小。在各组变量值不变时,权数绝对数成比例变化,即各组权数的比例不变,平均数就不会变化。
3.加权算术平均数:影响因素有各组变量值和权数
4.几何平均数及适用条件:连续变化,平均比率
5.众数与中位数:
众数:所有类型数据、不受极端值的影响,可能存在,也可能不存在,也可能有多个。适用于偏态分布数据
中位数:顺序数据和数值型数据,不受极端值的影响,偏态数据
6.数据分布与集中趋势:
对称:
左偏:
右偏:
7.离散程度
异众比率、分位差、极差(全距)、平均差、标准差、离散系数
8.标准差与方差:以有量纲的具体量说明数据离散程度,适用于平均水平相等的同类数据间的离散程度比较。
9.离散系数:标准差系数,以无量纲的系数形式说明数据的离散程度,适用于平均数不等或性质不同的数据间的离散程度比较。
10.极差:最易受到极端值的影响,说明数据变化的最大可能范围
11.四分位差:说明中位数的代表性
第五、六、七章:抽样推断
1.总体分布、样本分布、抽样分布
总体分布:总体中各个数据的分布
样本分布:样本中各个数据的分布
抽样分布:样本统计量的概率分布
总体的分布通过直方图观察,但一般不可能得到所有的数据,也就不能直接观察到总体分布。只要知道总体的分布类型和反映总体分布特征的参数就能够满足需要。
样本分布也称为经验分布,样本来源于总体,会包含总体的信息和特征,特别当样本容量较大时,样本的分布会很接近总体分布,但样本是随机抽取的,一般与总体分布有一定差异。
抽样分布是说明样本分布特征的统计量的分布,对它的理解是建立在反复抽样的基础上,样本是随机抽取的,不同的样本会有不同的统计量值,一个总体可以有很多个不同的样本,这样一个统计量就会有很多不同的取值,这些不同值的分布就是抽样分布。由于在实践中对于同一总体我们不会反复抽取很多样本,因此,抽样分布一般不能直接观察到,仅是一种理论分布。
抽样分布揭示了样本统计量与总体参数的内在联系,为统计推断提供了理论基础。
2.总体单位与抽样单位、样本容量与样本可能数目
3.统计量、总体参数及统计量的标准化
统计量是样本数据的函数,在实际抽样之前,由于是样本随机的,统计量也是随机的,但在抽取样本之后,样本已经确定,统计量也就是确定的,不包含任何未知变量。
总体参数是说明统计总体的数据特征值,一般是确定但未知的,是待估计的。
统计量的标准化是统计推断的必要过程,是将具体的统计量转化为已知分布的统计量,转化以后就可以确定一定区间的概率。
4.统计误差、抽样误差、抽样标准误差与抽样边际误差
统计误差是统计调查得到的值与客观实际值之间的差异。包括抽样误差和非抽样误差。
非抽样误差又称工作误差或调查误差,是指调查登记过程中由于登记、过录、计算等原因引起的误差。在全面调查和非全面调查中都有可能存在。
抽样误差也称为随机误差,是指在坚持了随机抽样的情况下,由于样本的随机性造成样本统计量与总体参数的差异。
样本是随机的,样本的统计量也是随机的,而总体参数是唯一的,因而抽样误差也是随机的。
在总体参数未知的情况下,一个具体样本的统计量与总体参数的实际抽样误差是不能直接观察到的,但在平均意义上,抽样误差是能够计算求得并可以控制的。
抽样误差一般用抽样标准误差来表示。抽样标准误差是样本统计量的标准差,在抽样方法(重复或不重复)、抽样方式(抽样组织形式)
您可能关注的文档
- “小升初”科學衔接试卷.doc
- 第1章质量检测.doc
- “小數乘小数练习课”教学设计.doc
- 第41课时向量的概念与线性运算.doc
- “少教多學”在小学英语课堂教学中的实践.doc
- 第33讲平面向量的概念及线性运算.doc
- 第2节基因对性状的控制(导学案).doc
- 第4章清末时期的新闻事业.doc
- “微”时代之微课发展意义与存在问题探析.PDF
- 第27章_相似单元测试卷(含答案).doc
- 四川省泸州市2025年联考第一次诊断性考试生物试题含解析.doc
- 北京市宣武区2024-2025学年初三年级生物试题周测三含解析.doc
- 2025年广东省深圳高级中学初三第二轮复习测试卷生物试题(一)含解析.doc
- 福建省厦门市六中学2025年初三下学期期终调研测试(一模)生物试题试卷含解析.doc
- 湖北省麻城思源实验校2024-2025学年初三(下)5月段考生物试题试卷含解析.doc
- 陕西省渭南市名校2025年全国中考大联考信息卷:生物试题试卷(2)含解析.doc
- 2025年湖北省武汉市东湖高新区重点达标名校初三中考调研测试(二)生物试题含解析.doc
- 城郊中学2025届初三生物试题三轮复习系列七-出神入化7含解析.doc
- 广东省深圳市罗湖区重点中学2025年中考适应性测试(6月1日)生物试题含解析.doc
- 新品口红宣传介绍.pptx
文档评论(0)