多元统计分析第4章10-1精要.ppt

下载文档 降价啦

4
0
约6.86千字
约 47页
2017-03-29 发布于湖北
举报
版权申诉
保障服务

多元统计分析第4章10-1精要.ppt

1、本文档共47页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

多元统计分析第4章10-1精要

* 判别分析方法步骤和框图第一步：判别分析的对象 1.确定在两个或者更多事先定义的组变量的平均得分是否存在显著差异 2.确定哪些变量在两个或更多的平均得分的差异解释最多 3.在一组变量得分的基础上，建立将对象分类的步骤 4.建立由这组变量形成的组与组之间判别函数的数目及构成。 * 判别分析方法步骤和框图第2步：判别分析的研究设计 1.解释变量和被解释变量的选择解释变量为定量变量，被解释变量为定性变量。被解释变量的组数可以是两个或更多，但这些组必须具有互斥性和完全性。解释变量的选择（1）根据以前的研究或者从该研究问题根本的理论模型中确定变量。（2）运用研究者的知识直觉选择。 2.样本容量每组至少有20个观测 3.样本的分割分割为两个子样本，一个用于估计判别函数，另一个用于验证。 * 判别分析方法步骤和框图第3步判别分析的假定如果解释变量的多元正态性不被满足，可以考虑使用Logistic回归。不等的协方差矩阵可能对于分类过程产生负面影响。观测会被“过度归类”到大的协方差阵的组中。注意多重共线性的影响，逐步判别可消除共线性。 * 判别分析方法步骤和框图第4步估计判别函数和评估整体拟合 1.计算方法联立法：考虑所有的解释变量逐步估计：逐步选入变量 2.统计显著性 Wilk’s Lammada, Hotelling迹和Pillai准则 Roy最大特征根只检验第一个判别函数 3.评估整体拟合（1）计算判别得分（2）检验组的差异（3）评价组关系预测精度 * 判别分析方法步骤和框图第5步结果的解释解释变量贡献度的问题。当保留两个或两个以上的判别函数时，需要一个综合的量来描述一个变量对所有显著函数的贡献。第6步结果的验证验证判别分析的结果，采用分割样本或者交叉验证法。 * 前面讨论的分类函数是基于定量变量， Logistic回归考虑的变量或部分变量可以是定性的。最简单的情况，被解释变量Y只取两个值，例如Y可能是“男性”或‘女性“，或者”就业“和”失业“。我们总可以将两个值记为0和1，例如可以令”男性“=0，”女性“=1，则1的概率p是我们感兴趣的参数。 0-1分布的均值=p，方差=p(1-p) 考虑对p建立模型 p=E(Y/z)=β0+ β1z §4.5 Logistic回归与分类 * Logistic回归与分类 p=E(Y/z)=β0+ β1z 但这个模型有严重缺陷：由于线性函数是无界的，因此Y的预测值可能大于1或小于0 回归分析的一个假定是：方差相等，但这里不适合。 Logistic模型不直接对概率p建立模型，我们先考虑”机会比”（odds ratio) Odds= 与概率不同,机会比可以大于1.若80%的旅客的行李不被海关检查，则p=0.8,则不被检查的机会是0.8/0.2=4，但机会比不是对称，因为被检查的机会是1/4,取自然对数后就变成了对称的。 * Logistic回归与分类当机会x为1，即出现0或1的机会相同，则X的自然对数为0，当机会x大于1，则自然对数随x的增加而缓慢增加。然后，当机会x小于1，则自然对数随x的下降而迅速增加到0。 * Logistic回归与分类 Logit(p)=ln(odds)=ln 在最简单的模型中，我们假定Logit(p)为预测变量Z的线性函数，即 Logit(p)=ln(odds)=ln = β0+ β1z Logistic模型可简单表示为 ln = β0+ β1z 先取两边的指数函数，得到再解出p(z) * Logistic回归与分类分类当观测单位属于总体1时，令Y=1，而当观测单位属于总体2时，Y=0 将Z归入总体1，若下面的判别函数大于0 * 神经元网络 “人脑是如何工作的？” “人类能否制作模拟人脑的人工神经元？” 　多少年以来，人们从医学、生物学、生理学、哲学、信息学、计算机科学、认知学、组织协同学等各个角度企图认识并解答上述问题。在寻找上述问题答案的研究过程中，近年来逐渐形成了一个新兴的多学科交叉技术领域，称之为“神经网络”。神经网络的研究涉及众多学科领域，这些领域互相结合、相互渗透并相互推动。不同领域的科学家又从各自学科的兴趣与特色出发，提出不同的问题，从不同的角度进行研究。　心理学家和认知科学家研究神经网络的目的在于探索人脑加工、储存和有哪些信誉好的足球投注网站信息的机制，弄清人脑功能的机理，建立人类认知过程的微结构理论。　生物学、医学、脑科学专家试图通过神经网络的研究推动脑科学向定量、精确和理论化体系发展，同时也寄希望于临床医学的新突破；信息处理和计算机科学家研究这一问题的目的在于寻求新的途径以解决目前不能解决或解决起来