厦门大学的应用多元统计分析第4判别分析.ppt

厦门大学的应用多元统计分析第4判别分析.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四节 费歇(Fisher)判别法 一 Fisher判别的基本思想 二 Fisher判别函数的构造 三 线性判别函数的求法 Fisher判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上,投影的原则是将总体与总体之间尽可能的放开,然后再选择合适的判别规则,将新的样品进行分类判别。 一、Fisher判别的基本思想 二、Fisher判别函数的构造 1、针对两个总体的情形 2、针对多个总体的情形 三、线性判别函数的求法 这里值得注意的是,本书有几处利用极值原理求极值时,只给出了不要条件的数学推导,而有关充分条件的论证省略了,因为在实际问题中,往往根据问题本身的性质就能肯定有最大值(或最小值),如果所求的驻点只有一个,这时就不需要根据极值存在的充分条件判定它是极大还是极小而就能肯定这唯一的驻点就是所求的最大值(或最小值)。为了避免用较多的数学知识或数学上的推导,这里不追求数学上的完整性。 第五节 实例分析与计算机实现 这一节我们利用SPSS对Fisher判别法和Bayes判别法进行计算机实现。 为研究某地区人口死亡状况,已按某种方法将15个已知地区样品分为3类,指标含义及原始数据如下。试建立判别函数,并判定另外4个待判地区属于哪类? X1 : 0岁组死亡概率 X 4 : 55岁组死亡概率 X 2 :1岁组死亡概率 X5 : 80岁组死亡概率 X 3 : 10岁组死亡概率 X6 : 平均预期寿命 表4.1 各地区死亡概率表 第四章 判别分析 第一节 引言 第二节 距离判别法 第三节 贝叶斯(Bayes)判别法 第四节 费歇(Fisher)判别法 第五节 实例分析与计算机实现 第一节 引言 在我们的日常生活和工作实践中,常常会遇到判别分析问题,即根据历史上划分类别的有关资料和某种最优准则,确定一种判别方法,判定一个新的样本归属哪一类。例如,某医院有部分患有肺炎、肝炎、冠心病、糖尿病等病人的资料,记录了每个患者若干项症状指标数据。现在想利用现有的这些资料找出一种方法,使得对于一个新的病人,当测得这些症状指标数据时,能够判定其患有哪种病。又如,在天气预报中,我们有一段较长时间关于某地区每天气象的记录资料(晴阴雨、气温、气压、湿度等),现在想建立一种用连续五天的气象资料来预报第六天是什么天气的方法。这些问题都可以应用判别分析方法予以解决。 把这类问题用数学语言来表达,可以叙述如下:设有n个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体)G1,G2, …,Gk中的某一类,且它们的分布函数分别为F1(x),F2(x), …,Fk(x)。我们希望利用这些数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来,并对测得同样p项指标(变量)数据的一个新样本,能判定这个样本归属于哪一类。 判别分析内容很丰富,方法很多。判断分析按判别的总体数来区分,有两个总体判别分析和多总体判别分析;按区分不同总体所用的数学模型来分,有线性判别和非线性判别;按判别时所处理的变量方法不同,有逐步判别和序贯判别等。判别分析可以从不同角度提出问题,因此有不同的判别准则,如马氏距离最小准则、Fisher准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等,按判别准则的不同又提出多种判别方法。本章仅介绍常用的几种判别分析方法:距离判别法、Fisher判别法、Bayes判别法和逐步判别法。 第二节 距离判别法 一 马氏距离的概念 二 距离判别的思想及方法 三 判别分析的实质 一、马氏距离的概念 图4.1 为此,我们引入一种由印度著名统计学家马哈拉诺比斯(Mahalanobis, 1936)提出的“马氏距离”的概念。 二、距离判别的思想及方法 1、两个总体的距离判别问题 问题:设有协方差矩阵∑相等的两个总体G1和G2,其均值 分别是?1和? 2,对于一个新的样品X,要判断它来自哪个总体。 一般的想法是计算新样品X到两个总体的马氏距离D2(X, G1)和D2(X,G2),并按照如下的判别规则进行判断 这个判别规则的等价描述为:求新样品X到G1的距离与到G2 的距离之差,如果其值为正,X属于G2;否则X属于G1。 我们考虑 这里我们应该注意到: 2、多个总体的距离判别

文档评论(0)

317960162 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档