- 1、本文档共110页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
三理论分布与抽样分布
但在实际工作中,总体标准差σ往往是未知的,因而无法求得 。此时,可用样本标准差S估计σ。于是,以 估计 。记 为 ,称作样本标准误或均数标准误。样本标准误 是平均数抽样误差的估计值。若样本中各观测值为 , ,…, ,则 (3-20) 注意,样本标准差与样本标准误是既有联系又有区别的两个统计量,(3-20) 式已表明了二者的联系。二者的区别在于: 样 本 标 准 差 S 是 反 映 样 本中各观测值 , ,…, 变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。 样本标准误是样本平均数 的标准差,它是抽样误差的估计值, 其大小说明了样本间变异程度的大小及 精确性的高低。 对于大样本资料,常将样本标准差S与样本平均数 配合使用,记为 ±S,用以说明所考察性状或指标的优良性与稳定性。 对于小样本资料,常将样本标准误 与样本平均数 配合使用,记为 ± , 用 以表示 所考察性状或指标的优良性与 抽样误差的大小。 4.2 两样本均数差数的抽样分布 设x1 ~ ,x2 ~ ,且x1与 x2相互独立,由这两个总体中抽样(无论样本容量n1、n2多大),则样本平均数之差( )服从正态分布,即 且总体参数有如下关系: (3-21) ~ 若所有样本均来自同一个正态总体x ~ ,则其平均数差数的抽样分布(不论样本容量n1、n2大小)服从正态分布,且 (3-22) 若所有样本均来自非正态的同一总体,则其平均数差数的抽样分布按中心极限定理在样本容量n1、n2相当大时(大于30)才逐渐接近于正态分布。 若所有样本均来自两个非正态总体,当 与 相差不太大,且n1和n2趋于无穷大时,其平均数差数的抽样分布逐渐趋于正态分布。 实际研究中 与 是未知的,常用S12与S22分别来代替,于是 常用 来估计,记为 称为均数差数标准误 (3-23) 其中,S12、S22分别是样本含量为n1、n2的两个样本方差。 如果两个总体的方差相等,即 那么, S12、S22都是 的估计值,这时应该用他们的加权平均值S02来估计 统计量: ~t( ) 4.3 学生氏t 分布 (t-distribution) 由样本平均数抽样分布的性质知道: 若x~N(μ, σ2), 则 ~N(μ, σ2/n)。 将随机变量 标准化得: , 则u~N(0,1)。 但当总体标准差σ未知时, 以样本标准差S代替σ所得到的统计量 记为t。 (3-26) ~t(df) 在计算 时,由于采用S来代替σ,使得t 变量不再服从标准正态分布,而是服从t分布。它的概率分布密度函数如下: (3-27) 式中, df=n-1为自由度,t的取值范围是(-∞,+∞) t分布的平均数和标准差为: μt=0 (3-28) (df2) (df1) t分布密度曲线如图3-11 所示 图3-11 不同自由度的t分布 (1)t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。 (2)t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布密度函数取得最大值。 (3)与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df 越小这种趋势越明显。df 越大,t分布越趋近于标准正态分布。当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n→∞时,t 分布与标准正态分布完全一致。 t分布的特点是: t分布的概率分布函数为: (3-29) 因而t在区间(t1,+∞)取值的概率—右尾概率为1-F t (df)。由于t分布左右对称,t在区间(-∞,-t1)取值的概率也为1-F t (df)。 于是 t 分布 曲线 下由
文档评论(0)