t分布与检验剖析.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
t分布与检验剖析

正态分布 1.1 什么是正态分布? 对于连续型随机变量而言,正态分布是最重要的一种概率分布,其形状似“钟型”。 经验表明:对于其值依赖于众多微小因素且每一因素均产生微小的或正或负影响的连续型随机变量来说,正态分布是一个相当好的描述模型。如身高、体重、考试成绩等。 1.2 正态分布的性质: ⑴ 正态分布曲线以均值?为中心,对称分布。 ⑵ 正态分布的概率密度函数呈中间高、两边低,在均值?处达到最高,向两边逐渐降低,即随机变量在远离均值处取值的概率逐渐变小。 ⑶ 正态曲线下的面积约有68%位于?± ?两值之间;约有95%面积位于?±2?之间;约有99.7%的面积位于?± 3?之间。这些区域可用作概率的度量。 ⑷ 正态分布可由两个参数?,?2来描述,即一旦知道?,?2的值,就可以根据附录表查到随机变量X落于某一区间的概率值。 ⑸ 两个(或多个)正态分布随机变量的线性组合仍服从正态分布。该性质很重要,解释如下: 1.3 标准正态分布 由于期望和方差的不同,正态分布之间会存在一定的区别(见下图),如何将其简单化,从而引入标准正态分布。 标准正态分布 如果变量X的均值为?,方差为?,定义一个新的变量Z, 例:变量X表示面包房每日出售的面包量,假定它服从均值为70、方差为9的正态分布,即X~N(70,9),求任给一天,出售面包数量大于75条的概率。 首先,定义变量Z,Z=(75-70)/3≈1.67 求:P(Z1.67) 查正态分布表得: P(0≦Z≦1.67)=0.4525 则:P(Z1.67)=0.5-0.4525=0.0475 即每天出售面包的数量超过75条的概率为0.0475。 t分布 回忆:若样本均值 ,则变量Z服从标准正态分布。 t分布的性质 ⑴ t分布与正态分布相类似,具有对称性。 ⑵ t分布的均值与标准正态分布均值相同,为0,但方差为k/(k-2)。由此,在求t分布的方差时定义自由度必须大于2。 标准正态分布的方差等于1,因此,t分布方差总大于标准分布的方差,也就是说,t分布比正态分布略“胖”些。 t分布表举例: 例:变量X表示面包房每日出售的面包量,在15天内,出售面包的样本方差为16。假定真实的出售量为70条,求任意15天内出售面包平均数量为74条的概率。 分析:本例中已知样本方差S2=16,则S=4,总体均值(真实的出售量)=70,运用t变量公式得: 关注某一总体,如纽约股票交易市场的1758支(90年9月4日)股票,想要研究该总体某一方面的统计特征,比如说股票价格与收入比(P/E)的平均值。在总体中抽取随机样本,如50支股票,求样本中每一支股票的P/E值,然后再计算平均P/E值,就称为总体平均P/E的估计量 假设检验 假设真实的?x 取某一特定值,如?x =13。然后去检验这个假设,检验结果是接受或拒绝该假设?下面以此为例说明。 4.1 置信区间法 在上述例子中,我们知道样本均值服从均值为?x ,方差为?2/n的正态分布,由于真实的方差未知,以样本方差代替。在这种情况下,样本均值服从t分布,从而得到?x 的一个95%的置信区间:10.63≦ ?x ≦12.36 (近似值) 置信区间提供了在某一置信度下(如95%)真实的?x 的取值范围。因此,如果这个区间不包括零假设中的值,如?x =13,则拒绝零假设,即我们以95%的置信度拒绝零假设。反之,接受零假设。 4.3 显著性检验 显著性检验是一种两者择一的假设检验,现通过P/E一例加以说明。 根据以下公式可知: 服从自由度为(n-1)的t分布。在具体应用中,、S、n已知, ?x 未知。 * * 为了方便,通常用: 表示随机变量X服从正态分布。 符号~表示随机变量服从什么样的分布; N表示正态分布; ?,?2为正态分布的(总体)均值(或期望)和方差。 X是一个连续型随机变量,可在区间(-∞,+∞)内任意取值。 ? -? -2? ? 2? 68%(近似) 3? -3? 95%(近似) 99.7%(近似) 正态曲线下的区域示意图 令: 假定X和Y相互独立,设a、b为常数,考虑线性组合:W=aX+bY 则有: 其中, ?1 ?2 不同均值,同方差的两个正态分布图 ?1 ?2 ?1=?2 不同均值,不同方差 相同均值,不同方差 则根据性质5,变量Z的均值为0,方差为1。在统计学中,我们称之为单位或标准正态变量,用符号表示为: 任一给定均值和方差的正态变量都可转化为标准正态变量,将其标准化可以大大简化计算。 1.67 0 0.4525 0.0475 f(Z) 标准正态变量概率密度函数 即: 假定已知?和?2的估计量S2,则可以用样本标准差(S)代替总体标准差(?),得到一个新的变量t。 根据统

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档