1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4回归分析

回归分析 1.两变量线性相关系数的计算 总体相关系数 为变量x的总体方差,为变量y的总体方差,为变量x与变量y的总体协方差。相关系数没有单位,在-1~+1范围内波动,其绝对值越接近1,两变量间的直线相关越密切;越接近0,相关越不密切。 样本线性相关系数(Pearson相关系数) 是变量x的样本方差,是变量y的样本方差,是变量x与变量y的样本协方差,为x的离均差平方和,为y的离均差平方和,为x与y的离均差乘积之和,简称离均差积和,其值可正可负。实际计算时可按下式化简: 例:(身高体重的例子) x=c(171,175,159,155,152,158,154,164,168,166,159,164) y=c(57,64,41,38,35,44,41,51,57,49,47,46) plot(x,y) 相关系数计算函数cor(x,y=NULL,method=c(“pearson”,”kendall”,”spearman”)) x为数值向量、矩阵或数据框 y为空或数值向量、矩阵或数据框 method为计算方法,包括“pearson”,”kendall”,”spearman”三种,默认为“pearson” 例: cor(x,y) [1] 0.9593031 2.相关系数的假设检验 n=length(x) r-cor(x,y) tr=r/sqrt((1-r^2)/(n-2)) tr [1] 10.74298 相关系数检验函数 cor.test(x,y,alternative=c(”two.sided”,”less”,”greater”),method=c(“pearson”,”kendall”,”spearman”),….) x,y为数据向量(长度相同) alternative为备择假设,分别表示双侧,左侧,右侧 method为计算方法,包括“pearson”,”kendall”,”spearman”三种 例: cor.test(x,y) Pearsons product-moment correlation data: x and y t = 10.743, df = 10, p-value = 8.21e-07 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.8574875 0.9888163 sample estimates: cor 0.9593031 由于p-value = 8.21e-070.05,于是在显著水平0.05上拒绝原假设,接受相关系数不为0,即该人群身高与体重呈现正的线性关系。 注:不能只看相关系数的大小来判断显著性。还需看其样本量大小。 二、一元线性回归分析 步骤: 建立回归模型; 求解回归模型中的参数; 对回归模型进行检验。 例:d4.3 财政收入与税收有密切的依存依存关系。d4.3给出我们1978年改革开放以来到2008年共31年的税收(x,百亿元)和财政收入(y,百亿元)数据,试分析税收与财政收入之间的依存关系。 步骤: (1)读入数据 ##在d4.3中选取B1:C32区域,然后拷贝 yx=read.table(clipboard,header=T) (2)拟合模型 fm=lm(yx$y~ yx$x) fm Call: lm(formula = yx$y ~ yx$ x) Coefficients: (Intercept) yx$x -1.197 1.116 于是得到回归方程: (3)作回归直线 plot(yx$x, yx$y) abline(fm) (4)回归方程的假设检验 1)模型的方差分析 anova(fm) Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(F) x 1 712077 712077 27428 2.2e-16 *** Residuals 29 753 26 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 由于p0.05,于是在0.05水平处拒绝原假设,即本例回归系数有统计学意义,x与y间存在直线回归关系。 2)回归系数的显著性检验 summary(fm) Call:

文档评论(0)

juhui05 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档