[统计学重点整理.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[统计学重点整理

参数(parameter):描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值、标准差、总体比例等。总体参数通常用希腊字母表示 统计量(statistic):用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等。样本统计量通常用小写英文字母表示 1、概率抽样:简单随机抽样(SRS)、系统抽样(SYS)、分层抽样(STS)、整群抽样(STS)、多阶段抽(MSS) 简单随机抽样(SRS) 特点:总体中每一个样本点均有相同机率被抽中、抽出某个样本后不影响另一个样本抽出的机率(独立性)、经常先列样本名册后用计算机产生随机数或随机表抽选 放回和不放回:放回(重复)抽样;无放回(不重复)抽样 系统抽样(SYS) 等距抽样:将所有样本列册以序号排列,先随机抽取第一个样本,接着每隔K个样本抽取下一个样本;间隔K的求法:Population size/ Sample size; 常用于电话抽样 (类似于简单随机抽样) 分层抽样(STS) 将总体区分为数个层(strata):层之间互斥且周延、层内性质相近、层与层之间差异明显 从每一层中简单随机抽取若干样本作为该层的代表,再将所有层总结集合 整群抽样(STS) 将总体区分为多个群集clusters:群集间互斥且周延、群集与群集间差异小、群集内类似总体 随机抽取数个clusters 将抽中的群集内每个样本均调查 多阶段抽样(MSS) 第一阶段:分群——整群抽样 第二阶段:分层——分层抽样 第三阶段… … 整群抽样的优点是实施方便、节省经费;整 群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。 抽样误差(理论上不可避免):由于抽样的随机性所带来的误差 (偶然性) 所有样本可能的结果与总体真值之间的平均性差异 影响抽样误差大小的因素:样本量的大小、总体的变异性 普查无抽样误差,但是普查误差可能比抽样误差大 非抽样误差:除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异 存在于所有的调查之中:概率抽样,非概率抽样,全面性调查 包括:抽样框误差、回答误差、无回答误差、调查员误差、测量误差 回答误差:理解误差、记忆误差、有意识误差 无回答误差:应答率的问题:酒吧打架致死事件,90%是被打死的那个人先动手的 ?误差的控制 抽样误差可计算和控制 非抽样误差的控制:合理选择抽样框、改良问卷、调查过程控制(调查结果进行检验、评估;现场调查人员进行奖惩的制度) 茎叶图Stem-and-leaf plot for YEAR(结婚年龄)(唯一一个没有丢失原始数据的统计表) 3、画表的一般原则: 合理安排统计表的结构、总标题内容应满足3W 要求、数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明、表中的上下两条横线一般用粗线,其他线用细线、通常情况下,统计表的左右两边不封口、表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一、对于没有数字的表格单元,一般用“—”表示、必要时可在表的下方加上注释 4、集中趋势表示:均值、中位数、众数、几何平均数 众数:出现次数最多的变量值 不受极端值的影响、一组数据可能没有众数或有几个众数、主要用于定性数据,也可用于定量数据 未分组数据:无众数(原始数据: 1 2 3 4 5 6 7 )、一个众数(原始数据: 1 2 3 3 3 4 5 )、 多于一个众数(原始数据: 1 2 3 3 4 4 5 ,此时众数为二者平均3.5) 分组数据:先在次数表中找出次数最多的那一组,称为「众数组」,一般以Mo来表示。若取众数组的组中点为众数,则称为粗众数。Czuber插补法 中位数(median):将一组数字由大排至小,位居中间的数值为该组数字的中位数。一般以Me来表示 各观察值与中位数差异的绝对值总和为最小。 以下列公式求出中位数: 均值(mean):集中趋势的最常用测度值、一组数据的均衡点所在 事实上,各个观察值与平均数差的总和为0、各个观察值与平均数差的平方和为最小 几何平均数(geometric mean):n 个变量值乘积的 n 次方根 数据必须为正值才能计算几何平均数 主要用于计算平均百分比(percentages)、比率(ratios)、指数(indexes)、成长率(growth rates)的计算 分位数:除了将数据作半切割外,我们也可以将数据切成四等分、十等分、或一百等分 切尾均值(tr

文档评论(0)

wangz118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档