网站大量收购闲置独家精品文档,联系QQ:2885784924

数学实验判别分析.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

希望寻找a使得SSG尽可能大而SSE尽可能小,即记方程|B-lE|=0的全部特征根为l1≥…≥lr0,相应的特征向量为v1,…,vr.D(a)的大小可以估计判别函数yi(x)=vi’x(=a’x)的效果.记pi为判别能力(效率),有最大的值为方程|B-lE|=0的最大特征根l1.使第30页,共31页,星期六,2024年,5月m个判别函数的判别能力定义为据此来确定选择多少判别函数。第31页,共31页,星期六,2024年,5月§3.1判别分析

(discriminantanalysis)某些昆虫的性别只有通过解剖才能够判别但雄性和雌性昆虫在若干体表度量上有些综合的差异。人们就根据已知雌雄的昆虫体表度量(这些用作度量的变量亦称为预测变量)得到一个标准,并以此标准来判别其他未知性别的昆虫。这样虽非100%准确的判别至少大部分是对的,而且用不着杀生。此即判别分析。第2页,共31页,星期六,2024年,5月判别分析(discriminantanalysis)判别分析和聚类分析有何异同?判别分析和聚类分析都是分类.但判别分析是在已知对象有若干类型和一批已知样品的观测数据(训练样本)后的基础上根据某些准则建立判别式.在聚类分析中,人们一般事先并不知道应该分成几类及哪几类,全根据数据确定。可以先聚类以得知类型,再进行判别.第3页,共31页,星期六,2024年,5月判别分析例子数据disc.txt:企图用一套打分体系来描绘企业的状况。该体系对每个企业的一些指标(变量)进行评分。指标有:企业规模(is)、服务(se)、雇员工资比例(sa)、利润增长(prr)、市场份额(ms)、市场份额增长(msr)、流动资金比例(cp)、资金周转速度(cs)等.另外,有一些企业已经被某杂志划分为上升企业、稳定企业和下降企业。第4页,共31页,星期六,2024年,5月希望根据这些企业的上述变量的打分及其已知的类别(三个类别之一:group-1代表上升,group-2代表稳定,group-3代表下降)找出一个分类标准,以对尚未被分类的企业进行分类。该数据有90个企业(90个观测值),其中30个属于上升型,30个属于稳定型,30个属于下降型。这个数据就是一个“训练样本”。判别分析例子第5页,共31页,星期六,2024年,5月Disc.sav数据第6页,共31页,星期六,2024年,5月1.根据距离判别的思想Disc.txt数据有8个用来建立判别标准(或判别函数)的(预测)变量,另一个(group)是类别每一个企业的打分在这8个变量所构成的8维空间中是一个点。这个数据在8维空间有90个点,由于已知所有点的类别,可以求得每个类型的中心。这样只要定义了距离,就可以得到任何给定的点(企业)到这三个中心的三个距离。第7页,共31页,星期六,2024年,5月最简单的办法就是:某点离哪个中心距离最近,就属于哪一类。一个常用距离是Mahalanobis距离。用来比较到各个中心距离的数学函数称为判别函数(discriminantfunction).这种根据远近判别的思想,原理简单,直观易懂。为判别分析的基础1.根据距离判别的思想第8页,共31页,星期六,2024年,5月距离判别法假设有两个总体G1和G2,如果能够定义点x到它们的距离D(x,G1)和D(x,G2),则如果D(x,G1)D(x,G2)则x∈G1如果D(x,G2)D(x,G1)则x∈G2如果D(x,G1)=D(x,G2)则待判1.根据距离判别的思想第9页,共31页,星期六,2024年,5月Mahalanobis距离假设m(1),m(2),S(1),S(2)分别为G1和G2的均值向量和协差阵,则点x到Gi的马氏距离定义为

D2(x,Gi)=(x-m(i))’(S(i))-1(x-m(i))其他一些距离为马氏距离的特殊情况,因此我们着重讨论马氏距离.马氏距离的好处是可以克服变量之间的相关性干扰,并且消除各变量量纲的影响.第10页,共31页,星期六,2024年,5月线性判别函数:当S(1)=S(2)=S时记如果W(x)0即D(x,G1)D(x,G2)则x∈G1如果W(x)0即D(x,G1)D(x,G2)则x∈G2如果W(x)=0即D(x,G1)=D(x,G2)则待判第11页,共31页,星期六,2024年,5月当m(1),m(2),S已知时,令a=S-1(m(1)-m(2))≡(a1,…,ap)’,则显然W(x)为x1,…,xp的线性函数,称为线性判别函数;a称为判别系数.第12页,共31页,星期六,202

文档评论(0)

xiaolan118 + 关注
实名认证
内容提供者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档