- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多项logit模型 应用统计软件,可以得到以上模型的参数估计和回归方程: 统计分析结论如下: 女性比男性的疗效好,其优势比为: 新疗法比传统疗法好,其优势比为: 多项logit模型 多项logit的模型检验 与二分数据logit模型的检验相类似 与其他模型比较 拟合优度检验 累积logit模型中,有的软件给出了对每个累积概率有相同效应的比例优势假设的得分检验 通过比较对每个j有相同β的模型,和对每个j有不同βj的更复杂的模型; 当模型拟合不好时,可以采用对不同累积概率有不同效应的更一般的模型。 第六章 逻辑斯蒂回归 Logistic回归模型 对列联表的分析,独立性检验可以初步了解属性之间是否相互独立,或是否相关;通过列联表的相合性检验,可以进一步知道属性之间的相合情况,包括方向和程度; Logistic模型可以更进一步拟合属性变量之间的函数关系,以描述变量之间的相互影响。 列联表中的数据是以概率的形式把属性变量联系起来的,而概率p的取值在0与1之间,因此,要把概率 与 之间直接建立起函数关系是不合适的。即 Logistic回归模型 实践中, 通常随着 连续增长或连续下降,其直观的曲线形态是S型。 一般有这种形状的数学函数 有以下形式: 称作logistic回归函数。 把以上函数线性化可以得到: Logistic回归模型 因此,人们通常把p的某个函数f(p)假设为变量的函数形式,取 称之为logit函数,也叫逻辑斯蒂变换。 因此,逻辑斯蒂变换是取列联表中优势的对数。当概率在0-1取值时,Logit可以取任意实数,避免了线性概率模型的结构缺陷。 类似的处理还有probit变换和双对数变换。 其中probit变换是将概率变换为标准正态分布的 值,形式为: Logistic回归模型 双对数变换的形式为: 以上变换中以logit变换应最为广泛。 假设响应变量Y是二分变量,令 ,影响Y的因素有k个 ,则称: 为二分数据的逻辑斯蒂回归模型,简称逻辑斯蒂回归模型。其中的k个因素称为逻辑斯蒂回归模型的协变量。 Logistic回归模型 最重要的逻辑斯蒂回归模型是logistic线性回归模型,多元logit模型的形式为: 其中, 是待估参数。根据上式可以得到优势的值: 可以看出,参数 是控制其它 时 每增加一个单位对优势产生的乘积效应。 概率p的值: Logistic回归模型 最简单的logit线性模型为: 则优势为: 以上指数关系说明: 每增加1个单位,优势变为原来的 倍; 此时的概率应为: Logistic回归模型 多元logistic模型参数的估计 采用极大似然估计方法 假设n次观测中,对应 的观测有 个,其中观测值为1的有 个,观测值为0的有 个,则参数 的似然函数: 可以使用迭代法求出参数的ML估计 由于计算的复杂性,可以利用统计软件得到。 Logistic回归模型 【例6.1】一般认为,体质指数越大(BMI≥25),表示某人越肥胖。根据3983人的体检结果有388人肥胖,肥胖组中患心血管病的数据见表6.1,试建立体质指数与患心血管病概率的logistic回归模型。 【解】根据题目知道是一元逻辑斯蒂回归问题。运用统计软件可以对参数进行估计得到: 于是logit模型为: Logistic回归模型 由得到的模型可知, 患病概率为: 当体质指数BMI变化1单位时,对数优势比将增加0.2570,优势比将增加 即: 含有名义数据的logit 前例中的协变量为定量数据,logistic回归模型的协变量可以是定性名义数据。这就需要对名义数据进行赋值。 通常某个名义数据有k个状态,则定义个变量 代表前面的k-1状态,最后令k-1变量均为0或-1来代表第k个状态。 如婚姻状况有四种状态:未婚、有配偶、丧偶和离婚,则可以定义三个指示变量M1、M2、M3,用(1,0,0)、 (0,1,0) 、(0,0,1) 、(0,0,0)或(-1,-1,-1)来对以上四种状态赋值。 含有名义数据的logit 例:某地25岁及以上人中各类婚姻状况居民的死亡情况见表6.2,试建立死亡率关于年龄和婚姻状况的logit模型。 其中,A表示年龄,M1、M2、M3表示婚姻状况 于是,估计的logit方程为: 含有有序数据的logit Logit模型的协变量也可以是有序数据 对有序数据的赋
文档评论(0)