- 1、本文档共245页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用多元统计.ppt应用多元统计.ppt应用多元统计.ppt
应用多元统计分析 §1.1 多元统计分析的应用 降维问题 主成分分析 因子分析 归类问题 判别分析 聚类分析 变量间的相互联系 回归分析 典型相关分析 多元数据的统计推断 理论基础 判别实例 疾病的鉴别 根据人均年消费性支出,将全国所有省、市和自治区进行分类。 §1.2 多元统计数据的图表示法 散布图矩阵 轮廓图 雷达图(蜘蛛图、星座图) 调和曲线图 切尔诺夫脸(脸谱图) §2.1 随机向量 随机向量的联合分布、边缘分布和条件分布 §2.3 正态随机向量 回归拟合值和残差 中心化和标准化 判别问题 判别(discriminate) 已知k个总体G1,G2,…Gk。 根据训练样品建立判别函数 根据判别函数对待判样品进行归类 判别方法 距离判别 贝叶斯(Bayes)判别 费希尔(Fisher)判别 逐步判别 §3.1 距离判别 判别准则(discriminate criterion)可写成: 判X ? G1, 当d(X,G1)d(X,G2) 判X ? G2, 当d(X,G1)d(X,G2) X 待判, 当d(X,G1)=d(X,G2) 马氏距离 马氏距离的性质 马氏距离不受变量单位的影响,是一个无单位的数值。 一般情况 时的距离判别 时的距离判别 实例 胃癌的鉴别 §3.2贝叶斯(Bayes)判别 最大后验概率准则 §3.3费希尔(Fisher)判别 基本思想 投影 即把K类的m维数据投影(变换)到某一个方向,使得变换后的数据,同类别的点“尽可能聚在一起”,不同类别的点“尽可能分离”,以此达到分类的目的。 两类Fisher判别示意图 Fisher 判别基本思想 向量a的求法 实例 多总体的Fisher判别 胃癌的鉴别 两总体的Fisher判别 投影后两方差相等 §3.4 判别效果的检验* §3.5 逐步判别* 实例 胃癌的鉴别 威沙特分布 霍特林分布 威尔克斯分布 第四章 聚类分析 系统聚类(层次聚类法)的基本思想 系统聚类的基本步骤 计算n个样品两两间的距离,构成距离矩阵, 记作D(0)。 n个样品自成一类,类与类间的距离与样品间的距离相同(除离差平方和外),即D(1) = D(0) 。 合并距离最近的两类为一新类。 计算新类与当前各类的距离。若类的个数等于1,转到步骤(5),否则回到步骤(3)。 画聚类图。 决定类的个数,及各类包含的样品数。 例1: 6个不同民族的标化死亡率与出生时的期望寿命 各民族之间的欧氏距离(标准化资料)D(1) 最短距离系统聚类D(2) 最短距离系统聚类D(3) 最短距离系统聚类D(4) 最短距离系统聚类D(5) 谱系聚类图(最短距离法) 藏族 哈萨克族 维吾尔族 朝鲜族 蒙古族 满族 最长距离系统聚类各民族之间的欧氏距离(标准化资料)D(1) 最长距离系统聚类D(2) 最长距离系统聚类D(3) 最长距离系统聚类D(4) 最长距离系统聚类D(5) 谱系聚类图(最长距离法) 藏族 哈萨克族 维吾尔族 朝鲜族 蒙古族 满族 §4.4系统聚类法的性质及类的确定 8种系统聚类法所得聚类图 对31个省市自治区的聚类 §4.5 动态聚类 凝聚点的选择 1.随机地选择 2. 人为选择,当人们对所欲分类的问题有一定了解时,根据经验,预先确定分类个数和初始分类,并从每一类中选择一个有代表性的样品作为凝聚点。 3.将数据人为地分为A类,计算每一类的重心,就将这些重心作为凝聚点。 初始分类 1、人为地分类 2、选择凝聚点后,将与其最近的凝聚点归并 3、选择凝聚点后,每个凝聚点自成一类,将样本依次归入其距离最近的凝聚点那一类,并立即计算该类的重心,以代替原来的凝聚点,再计算下一个样本的归类。 4、先对样本数据标准化,然后计算统计量 逐步批修改法 1、选凝聚点 2、按距离最近原则分类 3、计算每类的中心作为新的凝聚点,若新旧凝聚点重合,则过程结束,否则重复2、3直至达到终止的条件或达到指定的迭代次数。 逐个修改法 1、选凝聚点 2、按距离最近原则分类,对每一样品归类后立即计算该类的重心,以代替原来的凝聚点 3、将样品从头至尾再逐个按步骤2进行归类,若新的分类与上一次均相同,则结束,否则重复2、3直至达到终止的条件或达到指定的迭代次数。 逐个修改法(K-均值法) 1、人为定出三个数:K(分类数)、C(类间距离的最小值),R(类内距离的最大值),取K个凝聚点; 2、计算这K各凝聚点两两间的距离,若小于C,则将这两个点的中心作为新凝聚点,重复步骤2,直至所有凝聚点间的距离均不小于C为止。 3、将剩余样本逐个归类,对每一样品,计算改样品与所有凝聚点的距离,若最小距离R,则该样品作为新凝聚点,否则样本归入与它距离最近的凝聚点所在类,并立即计算该类
您可能关注的文档
最近下载
- 智慧牧场繁育系统设计方案.docx
- 教师近3年任教学科学生学业水平和综合素质.docx VIP
- 特种设备安全风险辨识标准查找方法清单汇编.docx VIP
- 4.11.1《探问人生目标》课件人教统编版道德与法治七年级上册2024新教材.pptx
- 小学四年级上册数学练习题大全.pdf VIP
- 小学四年级上册数学练习题大全.docx VIP
- 面粉厂企业安全生产风险分级管控和隐患排查治理双体系方案资料(2022-2023版).pdf VIP
- 高中数学5.1.2导数的概念及其几何意义课件.ppt
- 2020-2024年高考语文试题分类汇编(全国)文学类文本阅读(小说)(学生卷).pdf VIP
- 特种设备安全风险辨识清单——电梯.pdf VIP
文档评论(0)