- 1、本文档共42页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
非参数统计第二章讲述
第二章 单样本问题
经典统计关心的问题:已知总体
均值——位置变量
方差、标准差、极差——尺度变量
非参数统计关心的问题:
已知:样本
位置变量?
尺度变量?
例如:在对人们的收入进行抽样之后,自然要对“人均收入”和“中间收入”等概念感兴趣。这就与统计中的对总体的均值(mean),中位数(median)和众数(mode)等位置参数的推断有关。
也可能想要知道收入多少才能够算“最富的百分之五”之类的问题。这与分位点的推断有关系。
除了位置,我们也希望通过数据知道它的趋势和走向,这都是本章要研究的内容。
2.1 广义符号检验和有关的置信区间
例2.1
下面是世界上71个大城市的花费指数(包括租金),按递增次序牌类如下(这里上海是44位,指数为63.5)
27.8 27.8 29.1 32.2 32.7 32.7 36.4 36.5 37.5 37.7 38.8 41.9 45.2 45.8 46 47.6 48.2 49.9 51.8 52.7 54.9 55 55.3 55.5 58.2 60.8 62.7 63.5 64.6 65.3 65.3 65.3 65.4 66.2 66.7 67.7 71.2 71.7 73.9 74.3 74.5 76.2 76.6 76.8 77.7 77.9 79.1 80.9 81 82.6 85.7 86.2 86.4 89.4 89.5 90.3 90.8 91.8 92.8 95.2 97.5 98.2 99.1 99.3 100 100.6 104.1 104.6 105 109.4 122.4
问题:
(1)样本中位数M是否大于64.或者说是否指数小于64的城市的比例少于0.5(或指数大于64的比例是否大于0.5)
(2)样本下四分位点(0.25分位点) 是否小于64,。等价的说,是否指数小于64的城市的比例大于0.25(或指数小于64城市的比例是否小于0.75)
由于中位数也是分位点(0.5分位点)。所以,这两个问题实际上都是关于分位点的检验问题,只不过一个是关于 分位点,另一个是关于 分位点。这里面也出现了求 分位点 的 置信区间问题。
本例中,分布未知,观察直方图
从图中很难说这是什么分布,我们根据
分位点的定义,并通过与分位点相关的Bernoulli试验及二项分布的性质得到需要的结果。
如果 是总体的 分位点,那么意味着总体中约有比例 那么多的个体小于 。
显然,关于 分位点的推断等价于关于比例 的推断。
2.1.1 广义符号检验:对分位点进行的检验
广义符号检验:对连续变量 分位点 进行的检验。
狭义符号检验:仅针对中位数(或0.5分位点)
进行的检验。
假定检验的假设是:
备择假设可能是:
记样本中小于 的点数为 ,
大于 的点数为 。
并用小写的 和 分别代表 和 的实现值。
记
按照零假设,
与 之比应该约为 左右,或 大约等于 ,而
与 之比应该约为 左右,或者说
大约等于 。
如果 与 与此相差的很远,那么零假设可能有问题 。
在零假设 下, 应该服从二项分布 。
下面就在二项分布变量的检验中如何计算p值的问题给出一个表
这类检验之所以叫做“符号检验”,是因为 为用所有样本点减去 之后,差为正的个数,而
为用所有样本点减去 之后,差为负的个数。
大样本正态近似
比较小时,可以用二项分布的公式来计算精确 值。但当 比较大时,也可以用正态分布来近似。
如果在零假设 下,
那么当 较大时,则可以认为
2.1.2 基于符号检验的中位数及分位点的置信区间
例2.2 下面是随机抽取的22个企业的纳税额(单位:万元)。数据已经按照升幂排列
1.00 1.35 1.99 2.05 2.06 2.10 2.30 2.61 2.86 2.95 2.98 3.2
文档评论(0)