广义相加模型-EmpowerStats.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
广义相加模型 当因变量和自变量不呈线性关系时,可用广义相加模型( GAM)。GAM可对部分或全部的自 变量采用平滑函数的方法建立模型,函数可以是非参数的形式,适用于多种分布类型、多种复杂 非线性关系的分析。广义相加模型中因变量的分布类型、联系函数和广义线性模型相同。根据 Y 的分布, f(Y) 不同,常见的有: Y 的分布 联系函数名称 f(Y) 正态分布( normal ) Identity Y 二项分布( binomial ) Logit Logit (Y) Poisson 分布 Log Log (Y) -1 γ 分布( gamma) inverse 1/ (Y ) 负二项分布( negative binomial ) Log Log (Y) 软件自动检测应变量的类型,如果是连续性变量,自动默认采用正态分布和 identity 作为 联系函数。 如是两分类的,自动用 logit 做联系函数。 平滑拟合自由度 GAM 用 s(X) 替换β *X 。β*X 使用的自由度为 1。s(X) 的自由度取决于平滑程度,越平滑自由 度越小。最极端的情况是用一个参数估计的一条直线是最平滑的;另一极端是连接每个实际的数 据点是最不平滑的,这种情况下我们用尽了所有的自由度。广义相加模型可以指定平滑拟合自由 度。自由度越小,平滑程度越高,但拟合程度降低;自由度越大,平滑程度越低,拟合度越高。 默认值是用最低 GCV或 GACV值(广义交叉验证)的方法找到适当的平滑拟合自由度。 本模块不仅输出模型,而且输出每个观察记录的预测值及其标准误。不仅可以建模,还可用 于预测。输入数据文件中,应变量缺失的记录,只要模型中的自变量齐全,都可得出预测值及其 标准误。右击输出文件可以看到 XX_PRED.XLS文件,它含原数据文件(自变量完整的记录)加 预测值及其标准误两个变量。 例, DEMO数据曲线拟合 AGE、BMI与 SBP的关系,同时调整 SMOKE、ALH、EDU、OCCU,按性 别分层拟合。输入界面如下: 输出结果 结局变量 : Systolic BP, mmhg 变量分布 : gaussian 模型 : SBP ~ s(AGE,fx=FALSE,by=factor(SEX))+s(BMI,fx=FALSE,by=factor(SEX))+factor(SEX)+SMOKE+ALH +OCCU.NEW+factor(EDU.NEW) Linear terms effect Estimate Std. Error t value 95%CI low 95%CI upp P.value (Intercept) 132.7901 3.5116 37.8143 125.9073 139.6729 0 factor(SEX)2 -3.2621 2.1806 -1.4959 -7.5362 1.0119 0.1351 SMOKE -1.4649 2.0214 -0.7247 -5.4269 2.4971 0.4689 ALH 0.079 2.153

文档评论(0)

tianya189 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档