网站大量收购闲置独家精品文档,联系QQ:2885784924

07第六章概率与分布.ppt

  1. 1、本文档共96页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
曹贵康 西南大学心理学院 email:cgk@swu.edu.cn 主要内容 正态分布 抽样分布/样本分布 几个概念 随机现象:只有在实验或观察完成之后才知道结果,而在此之前是无法预知的,而且在重复进行时,其结果也未必相同的现象。 随机事件:随机试验的每一个可能结果。 随机变量:取值为随机现象各种可能结果(随机事件)的量化数值的具有随机性和规律性的变量。 概率 我们不仅关心一个随机现象有哪些可能的结果,更重要的是要知道每一个结果出现的可能性有多大。为了度量随机事件发生的可能性大小,引入概率。 回顾:50名大学生身高累的积次数分布表 几个概念(续) 概率分布:用图形或公式表达,描述随机变量各取值可能性大小。 次数分布就是一种概率分布,它实际上是一种经验分布。 下面要介绍的是几种统计学家已经总结出来的用公式表达概率密度函数的概率分布,称理论分布。 从次数分布图到正态分布图 当样本的容量及分组逐渐增加时,次数分布图将趋近于一条稳定而连续的曲线,这条曲线就称为连续随机变量的概率密度函数,一般记为f(x)。右面的动画演示的就是给从一正态总体中抽取的数据制作次数分布时,随着分组的增加,分布图越来越趋近于正态分布。 分布图的规律 在任何分布形态中(如正态分布、T分布,F分布),密度函数f(x)与横坐标所围的面积都是1,连续分布中表示某一范围的概率就是用在这两点之间,密度函数与横坐标所围成的面积的大小来反映。 分成多个部分的正态曲线 这里展示的分布的均值是100,标准差是10。我们已经在x轴上增加了表示数据分布中偏离于均值的以标准差表示的距离。 x轴(表示分布中的数值)的刻度是以10(也就是分布的标准差)为间隔从70增加到130,10是一个标准差的值。 分成多个部分的正态曲线 这曲线内的每条垂直线将曲线分成一个部分,每个部分由特定的值限定。例如均值100右端的第一部分由数值100和110限定,这表示偏离均值(均值是100)一个标准差。 分成多个部分的正态曲线 在每一个原始数值(70,80,90,100,110,120,130)下端,你会发现相应的标准差(-3,-2,-1,0,1,2,3 )。这里每一个标准差是10。因此偏离均值(均值是100)一个标准差就是均值加10或者是110。 分成多个部分的正态曲线 这个均值为100,标准差为10的正态分布表示的数值范围是70到130(包括-3到3个标准差)。 注意! 对任何数值分布来说(不论均值和标准差的具体数值),如果数值是正态分布的,几乎100%的数值处于均值的-3到3个标准差范围内。 所有的正态分布都是如此。 这使得不同数据分布之间可以相互比较。 正态曲线下数据值的分布 如果数值分布是正态的,我们也可以说一定百分比的数值会落在x轴的不同数据点之间(例如均值和一个标准差之间)。 如数值分布中有是34. 13%的数值落在了均值100和均值以上1个标准差(就是110)的范围内。 正态曲线下数据值的分布 如果将正态曲线每一半的百分值加起来…… 刚好是50%。正态曲线之下,均值和均值右侧所有数值的距离范围内包括了50%的数值。 因为曲线是中心线对称的,两个部分加起来表示100%的数值。 均值100左侧的数值呢? 注意 前面例子中使用的均值100和标准差10仅仅是特定案例的样本统计值。不是所有的分布都是均值为100、标准差为10。 实际上,34. 14% , 13. 59%等数值独立于实际的均值和标准差。粗略地说这个数字是34%,这是因为曲线的形状而不是因为具体的均值和标准差。 如果你在一个硬纸板上绘制正态曲线,接着将均值和一个标准差范围内的区域切下来,然后称出重量,重量恰好是从中切除曲线的整个硬纸板的34. 13%。 再看—— 在前面的案例中,68.26 %的数落在原始数据90到110之间。那么其他32%呢? 一半(16%,或者13.59% +2. 15% +0. 13% )落在均值的一个标准差以上(均值右侧),另一半落在均值的一个标准差以下(均值左侧)。而且因为曲线的斜率,所以数值越偏离均值,曲线覆盖的区域的范围就越小,那么一个数值落在数据分布极值范围内的可能性要小于落在中间的可能性。 标准分数?Z分数! 在一般的研究实践中,我们会发现所处理的分布相当不同,但是我们需要对它们进行相互比较。而进行这样的比较我们需要一定的标准。这就是标准值(或标准分数)。最常用的标准分数是Z分数。 Z值就是原始数据与数据分布均值的差除以标准差所得的结果。 Z分数的意义 z分数是一个原始分数与平均数之差除以标准差所得的商数,它无实际单位,与原始分数和平均数的距离成正比,与该组分数的标准差成反比。 如果一个数小于平均数,其值就为负数;如果一个数大于平均数,其值为正数;如果一个数的值等于平均数,其值为零。 可见Z分数可以表

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档