《统计学—基于R》(07)第7章--类别变量分析(R3).pptxVIP

《统计学—基于R》(07)第7章--类别变量分析(R3).pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共34页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据分析

(方法与案例)

作者贾俊平版权所有违者必究StatisticswithR统计学R语言

第7章类别变量分析7.1一个类别变量的拟合优度检验7.2两个类别变量的独立性检验7.3两个类别变量的相关性度量testc2

7.1一个类别变量的拟合优度检验7.1.1期望频数相等7.1.2期望频数不等第7章类别变量分析

2018-9-25利用Pearson-?2统计量来判断某个类别变量各类别的观察频数分布与某一理论分布或期望分布是否一致的检验方法比如,各月份的产品销售量是否符合均匀分布不同地区的离婚率是否有显著差异也称为一致性检验(testofhomogeneity)该检验也可用于判断各类别的观察频数分布是否符合泊松分布或正态分布等什么是拟合优度检验?

(goodnessoffittest)

7.1.1期望频数相等7.1一个类别变量的拟合优度检验

2018-9-25拟合优度检验

(期望频数相等)【例7-1】(数据:example7_1.RData)为研究消费者对不同类型的饮料是否有明显偏好,一家调查公司随机调查了2000个消费者对4种类型饮料的偏好情况,得到不同类型饮料的偏好数据如表7-1所示。饮料类型人数碳酸饮料525矿泉水550果汁470其他455合计2000

2018-9-25拟合优度检验

(期望频数相等)第1步:提出假设H0:观察频数与期望频数无显著差异(无明显偏好)H1:观察频数与期望频数有显著差异(有明显偏好)第2步:计算?2统计量自由度df=类别个数-1

2018-9-25拟合优度检验

(期望频数相等)?2统计量计算表由R函数得P=0.007。拒绝原假设,表明消费者对不同乐类型饮料的偏好有显著差异饮料类型碳酸饮料5255001.25矿泉水5505005.00果汁4705001.80其他4555004.05合计2000200012.10

2018-9-25拟合优度检验

(例题7—1)#期望频数相等时的拟合优度检验load(C:/example/ch7/example7_1.RData)example7_1?chisq.test(example7_1$人数)

7.1.2期望频数不等7.1一个类别变量的拟合优度检验

2018-9-25拟合优度检验

(期望频数不等)?受教育程度离婚家庭数小学及以下30初中110高中80大学25研究生15合计260

2018-9-25拟合优度检验

(期望频数不等)第1步:提出假设H0:不同受教育程度的离婚家庭数与期望频数无显著差异H1:不同受教育程度的离婚家庭数与期望频数有显著差异第2步:计算期望频数和?2统计量自由度df=类别个数-1

2018-9-25拟合优度检验

(期望频数不等)期望频数计算表受教育程度观察频数期望比例%期望频数=期望比例?样本量小学及以下30200.20?260=52.0初中110350.35?260=91.0高中80250.25?260=65.0大学25120.12?260=31.2研究生1580.08?260=20.8合计260100300

2018-9-25拟合优度检验

(期望频数不等)?2统计量计算表由于自由度=5-1=4,利用R函数得P值(右尾概率)为0.0006,由于P0.05。不拒绝原假设,没有证据表明该城市居民对房屋价格满意度的评价与全国有显著差异受教育程度小学及以下3052.09.3077初中11091.03.9670高中8065.03.4615大学2531.21.2321研究生1520.81.6173合5856

2018-9-25拟合优度检验

(例题7—2)#期望频数不相等时的拟合优度检验load(C:/example/ch7/example7_2.RData)example7_2chisq.test(example7_2$离婚家庭数,p=example7_2$期望比例)

7.2两个类别变量的独立性检验7.2.1列联表与?2独立性检验7.2.2应用?2检验应注意的问题第7章类别变量分析

7.2.1列联表与?2独立性检验7.2两个类别变量的独立性检验

2018-9-25研究两个类别变量时,每个变量有多个类别,通常将两个变量多个类别的频数用交叉表的形式表示出来一个变量放在行(row)的位置,称为行变量,其类别数(行数)用r表示

文档评论(0)

幸福是什么 + 关注
实名认证
文档贡献者

幸福是什么

1亿VIP精品文档

相关文档