- 1、本文档共47页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[其它]相关与回归
线性回归和相关 讲授:王柏松 变量间联系(relation) 在一个样本中,如果两个或多个变量值的分布是一致的模式,即它们的值有条理地彼此对应,则称这些变量是有联系的。 如大多数男性白细胞计数高,大多数女性白细胞计数低,则认为性别和白细胞计数间存在联系,反之亦然;高的人比矮的人重,则认为身高和体重之间存在联系;IQ高的学生在考试重犯错误较少,则认为IQ和错误数间存在联系; 变量间联系 广义上来讲,每一个研究或科学分析都是寻找变量间联系,科学的进展必然涉及到找到变量间新联系,相关研究和实验研究是以最直接的方式来测量这些联系, 统计学就是帮助人们评估变量间联系,所有的统计方法均可认为是评估不同的变量间联系。 联系的两个基本特点:程度(大小)和真实性(可靠性),二者是有联系的,样本数固定时,联系的程度越大,其可靠性越大。 相关回归应用范围 回归适用于分析变量间的依存关系;相关分析用于分析两变量间相互联系的密切程度及相关方向。 如两个变量间的关系是线性的,可用直线相关与回归分析;如两个变量间的关系是非线性的需用非线性(曲线)回归。 相关研究和实验研究 相关研究:不施加干预(或尽量不施加),测量变量,寻找它们之间关系(相关) 实验研究:施加干预,测量干预效果变量,也计算相关,尤其是被干预变量和效果变量,提供更好的信息,可更好揭示变量间关系 自变量和因变量 Independent variable vs. Dependent variable 自变量:被干预的变量,‘独立’于样本的最初的反应模式,特点,动机等 因变量:仅被测量或登记的变量,依赖于干预或实验条件,也就是依赖于样本将如何反应 根据某些试验前特征将样本分配到不同试验组,如比较男女白细胞计数,此时性别是自变量,白细胞计数为因变量 线性相关与回归变量特点 线性相关分析要求两个分析变量是连续型变量,它们都随机变动,处于同等地位。通过相关系数r来描述和度量它们数量上线性联系的程度。 线性回归的两个变量的地位是不同的,自变量x是可以随机变动,也可以是人为取值的;当x的数值确定时,应变量y按某种规律随机变动。 一、线性相关 相关分析的目的在于通过相关系数r来描述和度量两变量线性联系的程度和方向。 r0 正相关 r0 负相关 r=0 零相关 适用条件 两个变量均为数值变量,且为二元正态分布 两个变量间存在联系 相关系数的计算 相关系数的显著性检验 例题分析 例6.1 测定A药在血中和尿中的半衰期,以研究直接由由血中测定和间接由尿中测定是否存在相关,具体数据如表6.1 步骤 1、绘制散点图 直观地考察两变量之间是否存在线性关系。如图6.2 2、对变量X1和X2是否满足二元正态分布进行检验。 3、根据公式计算r。r=0.7205 4、r的假设检验 t=3.2854,P0.01 几点说明 相关分析只是以相关系数来描述两个变量间线性相关的程度和方向,并不阐明事物间存在联系的本质,也不是两事物间存在联系的证据。要阐明两事物间的本质联系,必须凭专业知识从理论上加以论证。因此,把两个毫无关系的事物放在一起作相关分析是毫无意义的。 目前各种型号的科学运算电子计算器中一般都有计算相关系数及回归方程的功能, 可迅速直接地求得相关系数。 应用统计软件不仅可求得相关系数,还可得到检验结果等其它统计量。 常见问题 有效范围 离群值(极端值):不常见值 样本来自不一致组,如不同试验组,不同组变量相关不一致 非线性关系 样本来自不一致组 非线性关系 例6.1 SAS程序 data dat1; input x1 x2; cards; 9.9 7.9 11.2 8.9 9.4 8.5 8.4 9.4 14.8 12 12.4 11.5 13.1 14.5 13.4 12.3 11.2 9.2 9.5 11 10.7 8.3 9.2 8.5 ; run; proc plot data=dat1; plot x1*x2=*/haxis=by 3 vaxis=by 3; run; proc reg data=dat1; model x2=x1/p;output out=r R=RES; run; proc univariate data=dat1 normal;var x1;run; proc univariate data=r normal;var res;run; proc corr data=dat1; var x1; with x2; run; 程序说明 数据逐个观测输入。 过程步调用CORR过程,后面可加上选择项pearson,表示计算pearson相关系数。也可不用任何选择项,因为默认值为pearson。 VAR和WITH语
文档评论(0)