- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * 请同学们参考《实用多元统计分析》由 Richard A. Johnson Dean W. Wichern 著 清华大学出版社 多元统计的难点在于变量太多。研究多元统计的主攻方向之一就是如何将高维数据投影到二维空间,并且在投影过程中不会过多地损失原有数据的信息,这样就可以使用这种方法在平面上画出这些原本属于高维数据的图形来。 THANKS * * * * * * * * * * * * * * * * * * * * * * * * 多元统计分析基础 生命科学 社会科学 统计分析方法 现象 多样性 复杂性 随机性 多元统计分析方法 多元回归分析方法 多元判别分析方法 聚类分析方法 …… 目的: 从看起来 杂乱无章 的数据中 发现提炼 规律性的结论 为什么学习多元统计分析 必备的知识 良好的 专业训练 必要的 统计分析工具 多元统计研究的内容 简化数据结构(降维问题) 将复杂的数据通过变量变化变得互补相关 将高维数据投影到低维空间(问题简化,信息丢失较少) 主成分分析 因子分析 分类与判别(归类问题)按照相似度进行分类 聚类分析 判别分析等 变量间的相互关系 回归分析 典型相关分析 多元数据统计推断 参数估计 假设检验 多元统计的理论基础 多元随机向量的分布及其性质 抽样分布理论等 随着计算机的发展,多元统计已经在自然科学、社会科学的各个领域得到广泛的应用。 教育学 医学 气象学 环境科学 地理学 考古学 服装工业 经济学 农业 社会科学 文学 以及其他各个领域 多元统计的应用 一元概率统计回顾主要关注基本概念和基本思想 随机变量 X (random variable) 在自然界中,有些变量在每次观察前,不可能事先确定其取值;经过大量反复观察,其取值又有一定的规律,这种变量称为随机变量X。 例 (1). 掷骰子出现某点数的概率为1/6,若掷100次,则出现该点数的次数X是随机变量; (2). 332路公车每10分钟发一趟车,某人在随机的时间到达车站等车,则等车时间X是随机变量。 1. 随机变量、概率分布 离散型随机变量 X的所有可能取值是有限个或可列个。 连续型随机变量 最常见的一类非离散型随机变量。 对连续型随机变量,考察事件{aXb}的概率。若存在非负的可积函数p(x),使得:对任意的a, b(ab),都有 则称p(x)为随机变量X的概率密度函数。 概率密度函数 (PDF, probability density function) 对所有随机变量X,可以定义以下的概率分布函数F(x): P(x)的性质: 收敛,则称E(X)为随机变量X的均值或数学期望。 xi:质点i的坐标;pi: 质点i的质量 ???E(X): 质心坐标 2. 随机变量的数字特征 均值(mean) 或数学期望(mathematical expectation) 离散型随机变量的均值 设离散型随机变量X的分布律为: 若 连续型随机变量的均值 设X为连续型随机变量,它的概率密度函数为p(x) ,若 收敛,则称E(X)为随机变量X的均值或数学期望。 小结: E(X)反映随机变量X的统计平均性质,代表随机变量取值的一般水平或集中的位置,略去了随机变量概率分布规律的具体细节。 方差(variance) 设随机变量X的均值为E(X),则: 对于离散型随机变量X,其方差为: 对于连续型随机变量X,其方差为: 计算D(X)的简单公式: 小结: D(X)反映随机变量X的相对于均值E(X)的偏离程度,代表随机变量取值的分散性,也是统计平均的性质。 正态分布(Normal distribution) 设随机变量X的概率密度为: 其中-??+ ?,?0均为常数。称X服从参数为?,?的正态分布,记作X~N(?,?2). ?:均值; ?:方差 ?=0; ?2=1时,称为标准正态分布,记为X~N(0,1)。 遵从正态分布的随机变量X,其正态分布函数为: 正态分布的若干性质 正态分布完全由其均值?和方差?2决定; 正态分布的概率密度函数曲线呈对称的“钟形”; 经验规则(3 ?准则): 68% 95% 99% ?+? ?+2? ?+3? ?-? ?-2? ?-3? ? p(x) x 3. 总体和样本 总体X (population) 研究对象的某种特征值的全体组成的集合。用X表示。 样本X1, X2, …, Xn (sample) 在总体中选取部分有代表性的子集称为(随机)样本。 一个样本是来自总体X的一组相互独立同X分布的随机变
您可能关注的文档
- 【案例分析】安盛-百威-企业文化分析报告.ppt
- 【森马公司案例】销售系统能力分析总结.pptx
- 【模板】企业公司理财背景.ppt
- 【步步高】2015届高中英语外研版(通用)【配套课件】:专题一动词的时态和语态.ppt
- 【极简线条】超现代年终总结报告模板.ppt
- 【活动】草莓采摘活动方案.ppt
- 【沪科版】2013年高考物理二轮复习课件:13-1光学电磁波相对论简介.ppt
- 【活动策划】如何做好一场活动.ppt
- 【清华电路原理课件】第17章网络图论基础.ppt
- 【物理】6.1《传感器及其工作原理》课件(新人教选修3-2).ppt
- 《运动处方》课件——慢性肺部疾病运动处方.pptx
- 《智能控制系统与工程》课件——4.智能控制系统与工程.pptx
- 大学英语四级考试2024年12月真题(第一套)Part III Reading Comprehension Section B.pptx
- 《助产综合实训》课件——阴道炎病人的护理.pptx
- 《自动化生产线集成与应用_ Integration》课件——设备管理与生产统计.pptx
- 大学英语六级考试2024年12月真题(第一套)Part I Writing.pptx
- 《助产综合实训》课件——外阴炎病人的护理.pptx
- 《自动化生产线集成与应用_ Integration》课件——库卡机器人基本操作指令.pptx
- 大学英语六级考试2024年12月真题(第一套)Part IV Translation.pptx
- 大学英语四级考试2024年12月真题(第一套)Part II Listening Comprehension.pptx
文档评论(0)