网站大量收购闲置独家精品文档,联系QQ:2885784924

数理统计11判别分析课件.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数理统计11判别分析课件.ppt

* 常见的聚类分析方法有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等等。 小论文 聚类分析和判别分析 用聚类分析方法对全国省和直辖市(或北京 市各区县)进行经济类型分类。数据可从统计 1. 年鉴上获得,自己选择决定经济类型的因素 变量。分类后进行解释,即是否符合直观判 2. 至少选取3个省市的数据,进行判别分析, 即将其进行归类。 断。 一 二 自己选择全国某行业,用聚类分析方法 进行类型分类。数据可从统计年鉴上 1. 获得,自己选择决定类型的因素变量。 分类后进行解释,即是否符合直观判断。 2. 建立判别分析方法,并对选择的对象进行回 报判别,用回报率说明方法是否适用。 三 或对自己感兴趣的问题建立判别分析方法。 * 达到最小的划分 为 其中 由定理所获得的划分 称为 划分 的Bayes解。 定理8.4给出了实际可行的具体判别方法。 对给定的样品 , 计算 个错判平均损失 错判平均损失 然后比较他们的大小,若 最小,则判定 。 推论 在定理8.4的条件下,若 (即错判的损失均相同),则 Bayes解为 此推论说明当错判损失相同时,Bayes解具 有上述更简单的形式。 三、Fisher判别 设有 个总体: 其均值和 协方差阵分别为 及 任 给一个样品 , 考虑它的线性函数 , 则在 来自 的条件下有 令 其中 ,则可得 其中 是所有元素都是 的 矩阵。 判别函数中的系数 的选取应使目标函数 达到极大,此时极大值 称为判别效率。 定理5 设有 个总体: 其均 值和协方差阵分别为 及 任给一个样品 , 则使得 正是矩阵 的最大特征值 所对应的特征 达到最大的线性判别函数 中的系数 向量,其中 是所有元素都是 的 矩阵。 判别方法:对给定的样品 , 计算 若存在 使得 成立,则判定 。 如果认为这种判别法还不很好的区分各个 总体,还可以由 的前 个特征值 所对应的特征向量 建立 个线性判别函数 这样 就相当于把原来的 个指标压缩成 个指标, 再用这 个指标,根据欧氏距离的大小来规定 的范围,即对 维空间 作划分 其中 当样品 时,则判定 。 四、聚类分析简介 聚类分析是研究物以类聚的一种方法. 分类问题在科学研究、生产实践、社会生活中到处存在。人们可以靠相关经验和专业知识对事物实现分类,但当反映事物的性质、特性的指标较多,且对分类要求较高时,仅评经验和专业知识就不能达到确切的分类目的,于是数学方法就被引进到分类问题中来。 聚类分析:根据研究对象的特征对究对象进行分类的多元分析技术的总称。 聚类分析的大部分应用都属于探测性研究,最终结果是产生研究对象的分类。 通过对数据的分类还能产生假设,聚类分析也能用于证实和检验,对于用其他方法获取的分类可以用聚类分析的方法进行检验。 聚类分析的核心思想 从一批样品的多个观测指标变量中,定义能度量样品间相似程度的统计量。 在此基础上,求出各样品之间的相似程度的度量值,按照相似程度的大小,将样品逐一归类,关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有的样品都聚集完毕。 把不同类型一一划分出来,形成一个亲疏关系谱系图,用以更直观的显示分类对象的差异和联系。 指标一般分为如下三类: (1)间隔尺度 如人的身高、体重;零件的长度、直径;元件的电阻等,即指标可以用连续的数值来表示。 (2)有序尺度 如酒可以分为好、中、次三等;考核等级可以分为优、良、中、差四级。即指标只可以用有序的等级号来描述,而没有明确的数量表示。 (3)名义尺度 如业余爱好有体育、音乐、诗画等;人的职业有工人、干部、教师等。 即指标既不能用数量来表示,也没有次序关系。 1. 聚类统计量 设所考察的对象有p项指标,今有n个样品,得 Q 型聚类:对n个样品进行聚类(学生分类) R 型聚类:对q个指标进行聚类(课程分类) (1)样品间的距离(R聚类) 样品间常用距离:绝对值距离dij(

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档