- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
简单相关和回归(SAS)
简单相关和回归(SAS) 广州医科大学 线性相关:两个随机变量X、Y之间这种呈线性趋势的关系Pearson相关系数:适用于测度两数值变量的相关性。局限性:变量服从正态分布;极端值对相关系数影响很大,必要时加以剔除或以变量变换,避免因一两个数值导致错误结果。Spearman相关系数适用范围:多用于测量两个有序变量之间的相关程度。(非参数检验)Kendall,s tau_b相关系数:侧重于两个分类变量均为有序分类情况,与Spearman相关系数相似。 问题1、 请对年龄、手术中的出血量(blood loss)、肿瘤最大直径(greatest diameter of tumor)进行相关分析,选取合适的相关系数。 第一组:年龄、手术中的出血量 第二组:年龄,肿瘤最大直径 第三组:肿瘤最大直径、手术中的出血量 1.建立假设: H0:ρ=0 H1:ρ≠0 α=0.05 2.计算检验统计量: 3.确定P值: 问题:用哪一种相关系数检验方法? Pearson相关系数:两个变量都是随机变量,且服从二元正态性分布 Spearman相关系数:不服从正太分布资料,总体分布未知资料和原始数据用等级表示的资料 结论:三个变量都不服从正态分布,所以用spearman相关系数检验。 data a; set resdat.pbl4; proc univariate normal plot; var age bloodloss tumor; run; Spearman相关系数过程步 proc gplot;(绘制散点图) plot x*y; run; proc corr spearman; (变量y与x进行相关性分析) var x y; run; (2)作散点图 初步结论:年龄与肿瘤最大直径之间没有线性趋势。 初步结论:失血量与肿瘤最大直径之间没有线性趋势。 线性回归:两个连续型变量之间线性依存变化关系的统计方法 1.线性(Line) :因变量和自变量组合之间的关系有线性趋势。(散点图) 2.独立(Independence):样本中的个体之间相互独立。 (专业知识,D-W统计量) 3.正态(Normal):给定各个X值后,相应的Y值服从正态分布。 (残差图) 4.等方差(Equal variance) :各X值变动时,相应的Y有相同的变异度。(残差图) 问题2、假设年龄与肿瘤最大直径(greatest diameter of tumor)都满足正态,请分别以age 和肿瘤最大直径(greatest diameter of tumor)互为因变量和自变量进行简单线性回归。 1.建立假设: H0:β=0,即年龄与肿瘤最大直径之间无线性回归关系 H1:β≠0,即年龄与肿瘤最大直径之间有线性回归关系 α=0.05 2.计算检验统计量: 3.确定P值: data c; set resdat.pbl4; proc gplot;(做散点图) plot age*tumor; run; proc reg;(做回归分析) model age=tumor; (年龄是因变量,肿瘤最大直径是自变量) plot r.*p.; run; proc reg; model age=tumor; (肿瘤最大直径是因变量,年龄是自变量) plot r.*p.; run; 决定系数R2 =0.0002,拟合优度很小。F=0.03,p=0.5869,接受原假设,得该直线回归方程在总体上不具有统计学意义。 同理,当年龄是自变量,肿瘤最大直径是因变量时,结论不变。 * (1)正态性检验 程序: data b; set resdat.pbl4; proc gplot; plot age*bloodloss age*tumor bloodloss*tumor; run; proc corr spearman; var age bloodloss tumor; run; 初步结论:年龄与失血量没有线性趋势。 由Spearman秩相关分析结果得,p0.05,r=0.243,说明失血量与肿瘤最大直径呈正相关关系,但相关关系并不密切(相关系数小于0.5),故拒绝H0,即年龄与手术中失血量两变量无相关关系;年龄与肿瘤最大直径两变量无相关关系;手术中失血量与肿瘤最大直径有相关关系。 程序: 结论:年龄与肿瘤最大直径没有线性趋势 散点图 初步分析:肿瘤最大直径为自变量,年龄为因变量,图显示没有线性回归关系,方差不齐及非正态性关系。 标准残差图 初步分析:年龄为自变量,肿瘤最大直径为因变量,图显示没有线性回归关系,方差不齐及非正态性关系。 标准残差图 *
文档评论(0)