- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章非参数统计.
凌洁 * 第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点 不要求总体分布已知或对总体分布作任何限制性假定; 不以估计总体参数为目的; 能适用于定性变量中的定类数据或定序数据 ,也能适用于定距数据和定比数据这种定量变量 方法直观,易于理解,运算比较简单。 缺点是检验的功效不如参数检验方法。 主要内容 χ2检验 成对比较检验 曼—惠特尼U检验 游程检验 等级相关检验 χ2检验 一、什么是χ2检验 χ2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验,也就是检验观察值与理论值之间的紧密程度。 设有k(K>2)个观察值,f0为它们的实际频数,fe为理论频数。构造一个统计量 其中,k-1为自由度。 皮尔生定理表明,当样本容量充分大时,样本分成K类,则χ2统计量服从χ2分布。自由度为k-1 1、拟合优度检验 二、应用 利用样本信息对总体分布作出推断,检验总体是否服从某种理论分布(如二项分布、均匀分布或正态分布等)。 检验步骤 抽样并对样本资料编成频数分布,形成k个互斥的类型组。 (f0) 对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布 以“原假设H0为真”导出一组期望频数(fe) 计算检验统计量 比较χ2值与临界值 作出检验判断 自由度(df)=k-1-m。 其中k为组数。(各组理论频数不得小于5,如不足5,可合并相邻的组,如需合并,则k为合并后的组数) m为计算理论频数时所估计参数的个数。(未指定总体的参数,需要观察值计算相应的统计量,作为未参数的估计值) 。 2、独立性检验 二、应用 用于判断两个变量是否存在交互影响。如果两个变量不存在交互影响,就称为独立,所以这类检验也称为独立性检验。 检验步骤 对总体的两个变量建立假设 H0:两变量独立 H1:两变量关联 将样本资料编成r×c列联表,并列出实际频数Oij 计算理论频数 计算检验统计量 比较χ2值与临界值 作出检验判断 要点说明 列联表形式(r×c) O11 O21 O31 . . . Or1 O12 O22 O32 . . . Or2 O13 O23 O33 . . . Or3 … … … . . . … O1c O2c O3c . . . Orc O1 O2 O3 . . . Or 1 2 3 . . . r 行 (r) 列(c) 1 2 3 … c x y 合计 n.1 n.2 n.3 … n.c n 合计 X的边缘频数 y的边缘频数 理论频数Eij的计算 先求理论频率(作为概率的近似)。概率论中关于概率独立的基本规则:如果两事件独立,则它们的联合概率等于它们各自概率的乘积,P(A·B)=P(A)·P(B)。因此,某一行某一列的联合概率: 自由度(df)的确定 df=(r-1)(c-1) r·c=2×2的列联表资料,χ2值简算公式 x y 1 2 1 2 a b c d a+c b+d a+b c+d 合计 合计 n 成对比较检验 是对两个相关样本的比较分析。有符号检验和威尔科克森带符号的等级检验两种方法。 符号检验 也称正负号检验,其基本思想是分析正负号出现的频率而忽略具体量的差异,以确定他们是否有显著差异的一种检验方法。 检验步骤 1.确定配对样本,分别计算差异正与负的数目,无差异则记为0,将它从样本中剔除,并相应地减少样本容量n,把正负号数目之和视为样本总个数(n) 。 2.建立假设:H0: p=0.5 ; H1:p≠0.5 3.观察样本容量,如果n≤25,则作为二项分布处理 如果n>25,则作为正态近似处理。 4.设定显著性水平α,并查表确定临界值,进行比较和作出判断。 例 1:随机抽取12个单位,放映一部描述吸烟有害健康的影片, 并调查得到观看电影前后各单位职工认为吸烟有害的人 数的百分比。检验该电影宣传是否有效果(α=0.05)。 解:H0:P=0.5 H1:P 0.5 P(0)=0.0002, P(1)=0.0030, P(2)=0.0161, P(3)=0.0537 P(0)+P(1)+P(2)=0.0193<0.05 P(3)+0.0193=0.0537+0.0193=0.0730.05 0 1 2 3 4 5 6 可见,拒绝域应为0,1,2。 7 8 9 10 11 12 拒绝域 现检验统计量(-)=3 (即3个负号),0.073>0.05所以,原假设H0:P=0.5在5%显著性水平上不能被拒绝。也即不能认为职工在观看影片前后的认识有显著提高。 例2:随机抽取60名消费者对甲、乙两种品牌的饮料评 分,甲 、乙得分之差为“+”
文档评论(0)