- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
SPSSAU数据不一致二元logistic回归原理
二元logistic回归数学原理
目录
1.二元logistic回归模型构建1
2.极大似然法3
3.Newton牛顿迭代法4
4.总结6
1.二元logistic回归模型构建
大家都知道,二元logistic回归时,其实际分析上是研究X对于Y的影响,而且Y
为二分类数据,比如是否愿意购买产品,是否喜欢,是否购买直播带货商品等。数字1
代表YES,数字0代表NO。而且X对于Y的影响时,数学模型可构建如下:
ln()=+++⋯+
01122
1−
上式中,ln()服从二元logistic分布,表示发生的概率,1-表示没有发生的概
1−
率,研究的数据Y只会有数字1和0,所以使用模型构建时,也希望本来原始数据是1,
那么模型拟合出来的预测值也尽最大可能接近1,本来原始数据是0,那么模型拟合出
来的预测值也尽最大可能接近0。而且等号右侧的X1,X2等均为研究的X即影响因素。
代表估计参数,分析上称其为回归系数。如果与SPSSAU结果对应则如下:
本案例数据,可点击下载
数据需要先上传至七牛后得到链接
上述中的回归系数值,即为二元logistic回归需要计算出来的值。那么该值是如何计
算得到的呢?首先:模型等式左边即ln(),表示发生的概率,1-表示没有发生的
1−
概率,研究的数据Y只会有数字1和0,所以使用模型构建时,也希望本来原始数据是
1,那么模型拟合出来的预测值也尽最大可能接近1,本来原始数据是0,那么模型拟合
出来的预测值也尽最大可能接近0。这是可以直接想到的,但如何估计得到呢?
这里使用到了数学上的“极大似然法”原理,即:当前比如有219个样本数据(219
行),那么就有219个Y值,而且219个Y值里面有的是数字1,有的是数字0,比如本
文档使用的数据Y为‘是否购买直播带货’,其中有194个为数字1即购买过直播带货,
25个没有购买过直播带货(数字为0)。既然出来了这样的结果,那么就说明当前这种
情况(194个为yes,25个为no),这种情况并非偶然而一种最大的可能(似想为什么没
有出现比如100个yes和94个no呢?),这种思想就称为“极大似然法”。接下来一部
分将单独讲解“极大似然法”。
2.极大似然法
接着上一部分,共有219个样本数据,对于‘是否购买直播带货’这个Y,其中194
个为yes,25个no。这种情况的产生并非偶然而是基于当前的6个影响因素X,对于Y会
产生影响,因而出现了此种情况(其中194个为yes,25个no)。正是由于6个影响因素
对于‘是否购买直播带货’这个Y的影响,出现当前最大的可能(其中194个为yes,25
个no)。
那么循着当前的“最大似然法”思维,构建出数学公式如下:
1−
=∏(1−)
=1
上式中,i代表219个样本的编号,n=219,i是
文档评论(0)