- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章 方差分析
例1、1977年,美国的某项调查从三种受过不同教育类型的妇女中各分别抽取了50位全日制工作的妇女样本,她们的年收入(单位:千美元)数据整理后归纳如下:
完成的学历年数
收入平均值( QUOTE )
初中(8年)X1
高中(12年)X2
大学(16年)X3
7.8
9.7
14.0
1835
2442
4707
解: QUOTE : QUOTE = QUOTE
QUOTE :三组收入均值有显著差异
F = QUOTE ,即组间均方/组内均方
其中,组间自由度 QUOTE =3-1=2,组内自由度 QUOTE =(50-1)╳3=147
由于样本均值 QUOTE =(7.8+9.7+14.0)/3=10.5
所以组间偏差平方和 QUOTE =50 QUOTE =50*( QUOTE + QUOTE + QUOTE )=1009
组内偏差平方和 QUOTE = QUOTE =1835+2442+4707=8984
所以,F = QUOTE ≈ 8.2548419 QUOTE (2,147)=3.07
拒绝原假设;认为不同学历的妇女收入存在差异。
例2、月收入数据:
男:2500,2550,2050,2300,1900
女:2200,2300,1900,2000,1800
如果用Y表示收入,哑变量X表示性别(X=1为女性),计算Y对X的回归方程,并在5%的水平下检验收入是否与性别无关(先求回归系数的置信区间)。
解:令Y= QUOTE + QUOTE X+ QUOTE
根据最小二乘法,可知 QUOTE = QUOTE (1)
VAR( QUOTE )= QUOTE (2)
QUOTE = QUOTE (3)
计算如下: QUOTE :收入与性别无关
QUOTE 收入与性别不完全无关
Y
2500
2550
2050
2300
1900
2200
2300
1900
2000
1800
X
0
0
0
0
0
1
1
1
1
1
240
290
-210
40
-360
160
260
-140
-40
-240
QUOTE =2150 QUOTE =0.5
根据公式1,得 QUOTE =-220; QUOTE ,即Y= QUOTE -220X+ QUOTE
根据公式2、3,得VAR( QUOTE )= QUOTE ≈156.3549577
n=10.,n-2=8;当df=8时, QUOTE =2.306
QUOTE 的0.05置信区间求解方法如下:
-2.036= QUOTE =2.306,得 QUOTE 140.57769.
由于原假设 QUOTE =0落入了这个置信区间,所以接受原假设,认为 QUOTE 系数不显著,收入与性别无关。
第二章 相关分析
例1、10对夫妇的一个随机样本给出了如下的结婚年龄数据
结婚时丈夫的年龄y
24 22 26 20 23 21 24 25 22 23
结婚时妻子的年龄x
24 18 25 22 20 23 19 24 23 22
1) 计算样本相关系数r;
2) 求总体相关系数的95%置信区间;
3) 以5%的水平,检验“夫妻的结婚年龄之间没有什么线性联系”这一原假设。
解:(1) QUOTE = QUOTE
由于 QUOTE =22, QUOTE =23; QUOTE = QUOTE ≈0.3426
(2)由于se( QUOTE )= QUOTE ,n=10,df=8 QUOTE =2.306,所以 QUOTE :
se( QUOTE )=0.332
-2.036= QUOTE =2.306
得 QUOTE 1.062072
(3) QUOTE :夫妻的结婚年龄之间没有线性相关, QUOTE
QUOTE 夫妻的结婚年龄之间不完全没有线性相关, QUOTE ≠0
根据第(2)题的计算结果, QUOTE 1.062072
由于 QUOTE 的原假设落入了该置信区间,所以接受原假设,认为夫妻的结婚年龄之间没有线性相关关系。
第三章 卡方检验和交互分析
例1、为了研究性别和“最希望看到的有关奥运会的电视节目类型”之间的关
文档评论(0)