网站大量收购独家精品文档,联系QQ:2885784924

统计学八九章资料.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
你的曲线是正态的吗? -概率和概率的重要性 目 录 一.为什么学习概率 二.正态曲线 三.Z值 一.为何学习概率 学习概率是理解正态曲线的基础,也是理解推论统计的基础。 1.正态曲线给我们提供了理解任何可能结果的概率的基础。 2.概率研究是决定我们在陈述特定的发现或结果是“真”时所具有的可信度的基础。 二.正态曲线(钟形曲线) 1.三个特点 (1)表示均值、中位数和众数相等的数值分布。 (2)以均值为中心完全对称。 (3)双尾是渐进的。 如:智力和身高的分布接近正态分布。正态曲线中极值范围内发生的每一件事情具有很小的发生概率。 2.更正态的曲线 (1)对于任何数值分布来说,如果数值是正态分布的,几乎100﹪的数值处于均值的-3到3个标准差范围内 (2)正态曲线下数据值的面积分布 A.68.26﹪面积在﹢1个S的范围内 B.95.46﹪面积在﹢ 2个S的范围内 C.99.37﹪面积在﹢ 3个S的范围内 三. Z值 1.含义:是基于不同数据分布的离散程度计算的,是以标准差为单位进行了标准化,是可比较的。 2.公式: 例:下面数据均值为12,标准差为2,样本规模为10 3.特点: A.均值以下的数值对应的Z值是负数,而以上的对应的Z值是正数 B.正的Z值一般落在均值的右侧,负的常落在均值的左侧,即数据分布的下半部分 C.Z值是偏离均值的标准差的个数 D.不同分布的Z值具有可比性 下表中均值为59,标准差为14.5,样本规模10 4. z值表示什么 A. 特定的Z值表示一个原始数值,也表示数据分布在x轴上的特定位置,且Z值越大,距离均值越远 B.若数据分布是正态分布,曲线的不同面积可以用标准差或Z值的不同数值来表示 - 84﹪的数值落在值为+1的Z值之下(50﹪落在均值之下,34﹪落在均值为+1的Z值之间) - 16﹪的数值落在值为+1的Z值之上(曲线下的全部面积是100﹪,84﹪的数值落在均值为+1的Z值之下) C.据Z值计算特定数值出现的概率 例:均值为100,标准差为10的数据分布中原始数值110-125之间的面积。 (1)分别计算原始数值110和125对应的Z值,即Z1=(110-100)/10=1;Z2=(125-100) /10=2.5 (2)使用附录B的B1找对应的面积,分别是34.13﹪,49.38﹪ (3)面积为49.38﹪-34.13﹪=15.25﹪ 显著性的显著 一、显著性的概念 二、显著性与意义 三、推论统计介绍 四、显著性检验介绍 一、显著性的概念 1.显著性的含义:指两个群体的态度之间的任何差异是由于系统因素而不是偶然性因素的影响。 2.统计显著性:指零假设为真的情况下拒绝零假设所要承担的风险水平。 3.第一类错误和第二类错误 真实情况 (未知) 所 作 决 策 接受 H0 拒绝 H0 H0 为真 正确 犯第I类错误 H0 不真 犯第II类错误 正确 检定力 A.第一类错误: 群体间没有差异的情况下拒绝了零假设。具有特定的值,且与任何零假设检验中定义的意愿承担的风险联系一起,一般设置的显著性水平在0.01-0.05之间。 注意:显著性水平与零假设的独立性检验相关,且不可以说对零假设的100次检验中我犯了5次或总数中的5%的显著性水平。 B.第二类错误: 群体间存在差异的情况下接受了虚无假设。与样本规模等因素相关。 注意:当个体数量增加时,第二类错误就降低。即样本的特征越与总体特征匹配,接受虚无假设的零假设的可能性就越低。 二.显著性与意义 1.统计显著性本身或内部是无意义的,除非所执行的研究具有合理的概念基础,可以由此推导结果显著性的意义。 2.统计显著性不能脱离发生的背景独立地解释。 3.统计显著性不是终极目标,也非唯一目标。 三.推论统计介绍 1.含义:基于样本特征推断总体的某些特征。 2.推论如何进行: 以青少年对母亲工作的态度作为案例 (1)研究者从母亲工作的青少年和母亲不工作的青少年中分别选择代表样本。 (2)每一个青少年进行一次测评来评价他或她的态度,接着计算群体的均值并使用一些检验方法来比较。 (3)可得出结论是成绩之间的差异是由于偶然性因素引起或是由于群体间真实的及统计显著的差异引起 (4)可以得出结论是从中选择样本的总体中母亲就业和青少年态度之间的关系。 3.如何选择用于检验的方法及流程表 四.显著性检验介绍 1.基本步骤: (1)零假设的陈述 (2)设置零假设的风险水平 (3)选择恰当的检验统计量 (4)计算检验统计量 (5)使用特定统计量的统计临界值表确定拒绝零假设需要的值 (6)比较实际值和临界值 (7)如果实际值大于临界值,不能接受零

文档评论(0)

三哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档