第三章判别分析-(精选·公开·课件).ppt

第三章判别分析-(精选·公开·课件).ppt

  1. 1、本文档共78页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
判别分析 例 中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标: X1总负债率(现金收益/总负债) X2收益性指标(纯收入/总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得如下资料: 判别分析的基本思想 判别分析与聚类分析的关系 区别:判别分析是在研究对象分类已知的情况下,根据样本数据推导出一个或一组判别函数,同时指定一种判别准则,用于确定待判样品的所属类别,使错判率最小。 聚类分析预先不知道分类,它要解决的问题,正是对给定的未知分类的样品进行分类,它是一种纯统计技术,只要有多指标存在,就能根据各观测的变量值近似程度排序,只是描述性的统计,而判别分析能对未知分类观测判别分类,带有预测性质。 联系:两者都是研究分类问题,两种方法往往联合起来使用。样品聚类是进行判别分析之前的必要工作,根据样品聚类的结果进行判别分析。 §2 距离判别 (一)马氏距离 距离判别的最直观的想法是计算样品到第i类总体的平均数的距离,哪个距离最小就将它判归哪个总体,所以,我们首先考虑的是是否能够构造一个恰当的距离函数,通过样本与某类别之间距离的大小,判别其所属类别。 设 是从期望μ= 和方差阵Σ= 的总体G抽得的两个观测值,则称 马氏距离和欧式距离之间的差别 马氏距离有如下的特点: 例 在企业的考核种,可以根据企业的生产经营情况把企业分为优秀企业和一般企业。考核企业经营状况的指标有: 资金利润率=利润总额/资金占用总额 劳动生产率=总产值/职工平均人数 产品净值率=净产值/总产值 三个指标的均值向量和协方差矩阵如下。现有二个企业,观测值分别为 (7.8,39.1,9.6)和(8.1,34.2,6.9),问这两个企业应该属于哪一类? 多总体距离判别 分为协方差阵相同和协方差阵不同两种情况,它们的判别函数有差异,而判别准则无差异。一般来说,用距离最近准则判别是符合习惯的,但会发生误判,各总体发生误判的概率和阀值的选择有关。当总体靠得很近,无论用那种方法误判概率都很大,作判别分析无意义。因此,判别分析的前提是各总体均值必须有显著差异。 二、Bayes 判别法 基本思想:贝叶斯判别法是源于贝叶斯统计思想的一种判别分析法 。这种方法先假定对研究对象已有一定的认识,这种认识以先验概率来描述,然后取得一个样本,用样本来修正已有的认识,得到后验概率分布,比较这些概率的大小,将待判样品判归为来自概率最大的总体。对多个总体的判别考虑的不是建立判别式,而是比较后验概率的大小。 办公室新来了一个雇员小王,小王是好人还是坏人大家都在猜测。按人们主观意识,一个人是好人或坏人的概率均为0.5。坏人总是要做坏事,好人总是做好事,偶尔也会做一件坏事,一般好人做好事的概率为0.9,坏人做好事的概率为0.2,一天,小王做了一件好事,小王是好人的概率有多大,你现在把小王判为何种人。。 距离判别简单直观,很实用,但是距离判别的方法把 总体等同看待,没有考虑到总体会以不同的概率(先验 概率)出现,也没有考虑误判之后所造成的损失的差异。 一个好的判别方法,既要考虑到各个总体出现的先验概 率,又要考虑到错判造成的损失,Bayes判别就具有这 些优点,其判别效果更加理想,应用也更广泛。 判别规则 二、 最小平均误判代价准则 在进行判别分析时难免会发生误判,各种误判的后果有所不同。我们可以根据误判的代价来规定判别规则,最小平均误判代价准则。 【定义】(平均错判损失) 【定理】 若总体G1,G2,?,Gk的先验概率为 含义是:当抽取了一个未知总体的样品值x,要判别它属于那个总体,只要先计算出k个按先验概率加权的误判平均损失 由此可见,要使ECM最小,被积函数必须在D1是负数,则有分划 特别 三、 典型判别法 然而,如果组数k太大,讨论的指标太多,则一个判别函数是不够的,这时需要寻找

文档评论(0)

夏天 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档