多元统计第四章判别分析.ppt

  1. 1、本文档共103页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元统计第四章判别分析

* * 目录 上页 下页 返回 结束 之后,点击“Continue”钮返回Discriminant Analysis对话框。点击“Save”钮,弹出Discriminant Analysis: Save New Variables对话框,选Predicted group membership项要求将回判的结果存入原始数据库中。点击“Continue”钮返回Discriminant Analysis对话框,其他项目不变,点击“OK”钮即完成分析。在输出结果中可以看到各组均值、标准差、协方差阵等描述统计结果以及判别函数,返回数据表中,可以看到判别结果已经作为一个新的变量被保存,广东和西藏均被划分到第二大类,篇幅所限,各输出结果在此不再列示。 * * 目录 上页 下页 返回 结束 【例4.6】 2005年全国各地区农村居民家庭人均消费情况可划分为三种类型,分类后的数据见表4-2。试用SPSS软件建立Bayes判别函数,并将待判样品归类。 解:本例中的组数为k=3,判别指标为p=8,各组中的样本为n1=3,n2=15,n3=11,在SPSS中进行贝叶斯判别分析时,操作步骤与例4.5中的费歇尔判别相同,但是在Discriminant Analysis--Statistics对话框的Function Coefficients栏中药选Fishers项而不是Unstandardized项(因为Bayes判别的思想是由Fisher提出来的,故SPSS以此命名)。 点击OK得出分析结果,部分如下: * * 目录 上页 下页 返回 结束 * * 目录 上页 下页 返回 结束 * * 目录 上页 下页 返回 结束 根据判别函数,就可以对原各组样品以及待判样品进行回判和判别,此时在SPSS中返回原数据表,可以看到一个新的变量名为Dis_1,其对应的各值就是对各地区的回判和判别结果,可知广东被划分到第二类消费水平地区,西藏被划分到第三类消费水平地区,并且原各组样品的回报误判率为零。以上判别结果综合整理列于表4-10。 其中,第一张表所示为各组以及总体的均值和标准差;第二张表位总体的协方差矩阵,可以计算其逆矩阵 ;第三张表示各组判别函数的估计结果,例如第一组的判别函数表达式为: y=-0.214x1-0.086x2-0.156x3-0.107x4+0.446x5 -0.060x6+0.568x7-1.743x8-257.686 * * 目录 上页 下页 返回 结束 * * 目录 上页 下页 返回 结束 在例4.5和4.6中,我们是将事先确定的所有八个指标变量都选入来进行判别分析,在实际应用中,我们也大多是设计尽可能多的相关指标来进行聚类和判别分析,然而事实是,指标太多不仅增大了计算量,而且那些对判别无用的指标也会干扰我们的视线。因此对众多指标进行筛选,找出对判别函数贡献比较突出,具有较强判别能力的指标成为一个很重要的事情。凡是具有筛选变量能力的判别方法统称为逐步判别法,有关这些方法的具体论述可见参考文献[2]。 * * 目录 上页 下页 返回 结束 在此我们以例4.6为例介绍逐步判别法在SPSS中的实现。操作步骤仍与例4.5类似,不同之处在于点击“Analyze”→“Classify” →“Discriminant”,打开Discriminant Analysis对话框后,将Independents栏下的“Enter independents together”项改选为“Use stepwise method”,此时窗口最下面一行的“Method”按钮被激活,点击后进入Discriminant Analysis:stepwise method对话框,在method栏中选中Mahalanobis distance项,即采用马氏距离,其他选项保持不变,返回主对话框后,其他操作仍按例4.5进行,点击“OK”得到输出结果,部分列举如下: * * 目录 上页 下页 返回 结束 * * 目录 上页 下页 返回 结束 以上是逐步回归部分的结果: 第一张表说明了每个步骤变量的加入和剔除情况; 第二、三张表说了进入和没有进入判别函数的变量的情况,只有X5和X7进入了判别函数,这两个指标的地区差异较大,对判别函数贡献显著; 第四张表说明了判别函数的显著性,最终仅包含X5和X7的两个变量的判别函数是显著的(F统计量),其他部分与前面两例相同。 返回原始数据表,同样可以看到一个新的变量名为Dis_1,其对应的各值就是对各地区的回判和判别结果:

文档评论(0)

5500046 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档