数据的统计描述和分析课件.pptVIP

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

抽样分布理论参数估计假设检验Matlab统计工具箱

【主要内容】香港大学民意研究计划成立于1991年6月,现时隶属香港大学社会科学学院,由钟庭耀博士负责,旨在为学术界、新闻界、决策人员及社会人士提供有用的民意数据,服务社会。民研计划自1992年12月开始,便定期调查香港市民对两岸三地政府的信任程度、及对前途的信心程度的意见,作为国家民族意见调查系列的一部分,18年来没有改变。现在我们以该中心在2010年12月14日发布的调查结果,来了解一下数理统计的5个组成部分.

【抽样技术】特区政府统计处资料显示,截至2010年年中,香港特区人口数目706.12万。(http://)n如何从这超过700万个选民中选取1000个样本,使这样本可以在某种程度上反映总体的信息?n调查方案设计,问卷设计【参数估计】n怎样从这1000个左右的数据来估计超过700万香港特区居民对特首的支持度?(点估计)n用1000个左右的数据来估计超过700万的总体信息,必然会产生误差.如何给出误差的范围,以及此误差范围的可信程度?(区间估计)

【假设检验】在10年11月底所做的调查中,曾荫权的支持度为40%,在这次调查中数据已下跌至37%,是否可以认为两个星期内曾荫权的支持度有明显下跌,或者说已经跌破4成?【方差分析】以往的选举经验告诉我们,有很多的因素会影响选民的投票意向。譬如:选民的政治取向,投票意欲,性别,年龄,教育程度,职业,家庭所属阶级,等等。那么,在这个案例中,如何判别其中某个因素是否真的影响了香港市民对曾荫权的支持程度?【回归分析】假如经过分析,我们发现选民的年龄与支持程度存在相关关系。那么,我们怎样去描述这种关系?

【主要任务】数理统计学是一门应用性很强的学科。其任务就是研究有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确而可靠的结论。u由于大量随机现象必然呈现规律性,只要对随机现象进行足够多次观察,被研究的规律性一定能清楚地呈现出来。u客观上,只允许我们对随机现象进行次数不多的观察试验,我们只能获得局部观察资料。

部分推断总体在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。在数理统计研究中,人们往往研究有关对象的某一项(或几项)数量指标。为此,对这一指标进行随机试验,观察试验结果全部观察值,从而考察该数量指标的分布情况。这时,数量指标的全体就是总体;每个数量指标就是个体。一个灯泡的寿命个体一辆国产轿车每公里的耗油量总体该批灯泡寿命的全体国产轿车每公里耗油量的全体

【概念】有限总体X无限总体总体——研究对象的全体总体实际中,人们关心的是总体中的个体X个体——总体中每个成员i的某项指标(如人的身(X,X高、…灯泡,X的寿)命,汽车样本——从总体中抽取的一部分个体样本容量——样本中所含个体的个数12n的耗油量…).n由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性。从而可以把这种数量指标看作一个随机变量X,因此随机变量X理论上将总体与概率分布等同的分布就是该数量指标在总体中的分布.如:正态总体X

【关于样本】样本也称“简单随机样本”间相互独立,且与总体X具有相同的分布总体很大,无放回抽样【样本值】样本的观察值叫样本值

【样本分布】若总体则样本的分布函数为

由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.这种不含任何未知参数的样本的函数称为统计量。它是完全由样本决定的量。一般表示为:T=g(X,X,…,X)n121°统计量用于统计推断,故不应含任何关于总体X的未知参数;2o统计量是样本的函数,它是一个随机变量,统计量的分布称为抽样分布.

【样本矩】设有样本,其观察值为它反映了总体均值的信息【1】样本均值其观察值为用于推断:E(X)【2】样本方差用于推断:D(X)

【3】修正样本方差未修正样本方差与修正样本方差的关系:【注意】1°当n较大时,与差别微小;2°当n较小时,比有更好的统计性质.

【4】样本k阶原点矩【5】样本k阶中心矩特例:特例:

【分位数】u设X~F(x),,若存在满足则称T为X的水平为a的下侧分位数或下a分位数.a则称为X的水平为的上侧分位数或上a分位数.u若X的密度函数是对称函数(偶函数),则称满足则称为X的水平为的双侧分位数.特别地,若

【正态分布的分位数】设X~N(0,1),若对给定的a,存在u使得a则称u为X的上a分位数(点)a

【分布】若相互独立,且,则服从自由度为的分布,记为性质1:性质2:

【t分布】若则

您可能关注的文档

文档评论(0)

139****0945 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档