《04统计推断.docVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《04统计推断

第4章 统计推断 4.1 样本与抽样分布。 (1)总体与样本。 总体:调查对象的全体叫总体。 样本:由总体中抽出的若干个体组成的集合叫样本。 统计量:样本的函数叫统计量。例如样本均值:= 和样本方差:S 2 = 都是统计量。 (2)抽样分布。 ① 抽样的基本概念。前面介绍收集数据的方式有二种: 优点:对每一个个体都进行观测。 全面调查(普查) 要花费大量的时间,人力,物力,财力。 缺点: 对无限总体无法作普查。 容易出现观测误差。 节省资金、节省时间、精确度高。 优点: 抽样调查 对于只有用破坏性实验才能取得数据的总体只能采用抽样调查。 缺点:有抽样误差。 ② 样本的二重性:(1)样本特征在某种程度上反映了总体特征。(2)又不能完全精确地反映总体特征。 ③ 实际中要解决二个问题:抽样方法。怎样抽(包括方式和容量)才能更合理地反映总体。统计推断。怎样用样本对总体做出科学的推断。 随机数表 对于有限总体:(1) n个随机变量与总体X有相同的概率分布。(2) 它们是相互独立的(对每个个体都进行独立观察)。(3) 要保证有限总体中每个可能的样本组合都有相等的概率被抽中。这种抽样方法称作简单随机抽样。如此得到的样本,称简单随机样本,简称样本。 实践中怎样保证得到简单随机样本呢?只要样本容量n与总体容量N的比值? 0.05,则先建立抽样框,利用抽签或随机数表连续抽取n个个体就可近似看作为一个简单随机样本。简单随机抽样分有放回抽样,和无放回抽样。但一般采取无放回抽样。这种抽样的特点是每个个体被抽中的概率是不同的,但每个样本作为随机变量的组合被抽中的概率是相同的。 对于无限总体:常采用连续观测的方式获得样本。 (3)样本平均数的抽样分布 ① 设 (x1, x2, …, xn) 是总体x ? N (? , ? 2 ) 的随机样本,=,则 ? N(? ,), U = ? N(0, 1) n ? ∞,? ?,样本容量越大,离 ? 越近。 ② 当x不服从正态分布时,在n ? 30 条件下,依据中心极限定理可认为, 渐近服从正态分布N(?,),U = 渐近服从N (0, 1) 从实际中看也是这样。例如有8042张发票面额的分组频数表显示该总体是非正态、右偏倚的(文件名:stat06),? = 20,? = 30(见图 4.1)。以样本容量为 n =3,n = 10,n = 100 各抽取600次,得到关于的三个频数分布,见图 4.2。随着样本容量的增大,的分布越来越接近正态分布。 图 4.1 发票面额的分组频数表 (? = 20,? = 30) 图4.2 n=3, n=10, n=100的抽样分布(=30.3) (4) t分布 t分布密度曲线见图4.3。t分布以纵轴对称,也呈钟形。当n为有限值时,t分布的峰值小于正态分布的峰值,而尾部要比正态分布的厚,即t分布呈低峰厚尾特征。当t ? ?,t分布趋近于标准正态分布。实际中,当n 30,t分布就很近似于标准正态分布。 t分布的均值和方差分别为 E(t(n) ) = 0, Var(t(n) ) = n / (n -2), n 2 图4.3 t分布密度曲线 (5)样本平均数的分布。 t = ? t(n –1) 如果减均值除以的样本标准差,则统计量服从(n –1)个自由度的t分布。当t分布的自由度在30以上时,t分布已经很接近标准正态分布。 学习查t分布表。t0.95(30) = 1.70 (6)F分布 图4.4 F分布密度曲线 服从F分布的密度曲线见图4.4。F分布密度曲线是单峰的,右偏倚的。随着自由度n1和n2的加大,F分布的众数趋近于1。F分布的分布密度曲线随二个自由度的不同而不同。 学习查F分布表。F0.05 (5, 30) = 2.16。 (7) 样本比率的抽样分布 设容量为N的总体中,具有某种性质的元素数为X个,则关于具有这种性质的元素数的总体比率是 p = 若从该总体中抽取容量为n的样本,具有该种性质的元素数为x,则关于该种元素的样本比率是 = E() = E(x) =n p = p Var() =Var (x) == 对于大样本(n p ? 5, n (1-

文档评论(0)

lisufan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档