- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 请同学们参考《实用多元统计分析》由 Richard A. Johnson Dean W. Wichern 著 清华大学出版社 多元统计的难点在于变量太多。研究多元统计的主攻方向之一就是如何将高维数据投影到二维空间,并且在投影过程中不会过多地损失原有数据的信息,这样就可以使用这种方法在平面上画出这些原本属于高维数据的图形来。 THANKS * * * * * * * * * * * * * * * * * * * * * * * * 多元统计分析基础 生命科学 社会科学 统计分析方法 现象 多样性 复杂性 随机性 多元统计分析方法 多元回归分析方法 多元判别分析方法 聚类分析方法 …… 目的: 从看起来 杂乱无章 的数据中 发现提炼 规律性的结论 为什么学习多元统计分析 必备的知识 良好的 专业训练 必要的 统计分析工具 多元统计研究的内容 简化数据结构(降维问题) 将复杂的数据通过变量变化变得互补相关 将高维数据投影到低维空间(问题简化,信息丢失较少) 主成分分析 因子分析 分类与判别(归类问题)按照相似度进行分类 聚类分析 判别分析等 变量间的相互关系 回归分析 典型相关分析 多元数据统计推断 参数估计 假设检验 多元统计的理论基础 多元随机向量的分布及其性质 抽样分布理论等 随着计算机的发展,多元统计已经在自然科学、社会科学的各个领域得到广泛的应用。 教育学 医学 气象学 环境科学 地理学 考古学 服装工业 经济学 农业 社会科学 文学 以及其他各个领域 多元统计的应用 一元概率统计回顾主要关注基本概念和基本思想 随机变量 X (random variable) 在自然界中,有些变量在每次观察前,不可能事先确定其取值;经过大量反复观察,其取值又有一定的规律,这种变量称为随机变量X。 例 (1). 掷骰子出现某点数的概率为1/6,若掷100次,则出现该点数的次数X是随机变量; (2). 332路公车每10分钟发一趟车,某人在随机的时间到达车站等车,则等车时间X是随机变量。 1. 随机变量、概率分布 离散型随机变量 X的所有可能取值是有限个或可列个。 连续型随机变量 最常见的一类非离散型随机变量。 对连续型随机变量,考察事件{aXb}的概率。若存在非负的可积函数p(x),使得:对任意的a, b(ab),都有 则称p(x)为随机变量X的概率密度函数。 概率密度函数 (PDF, probability density function) 对所有随机变量X,可以定义以下的概率分布函数F(x): P(x)的性质: 收敛,则称E(X)为随机变量X的均值或数学期望。 xi:质点i的坐标;pi: 质点i的质量 ???E(X): 质心坐标 2. 随机变量的数字特征 均值(mean) 或数学期望(mathematical expectation) 离散型随机变量的均值 设离散型随机变量X的分布律为: 若 连续型随机变量的均值 设X为连续型随机变量,它的概率密度函数为p(x) ,若 收敛,则称E(X)为随机变量X的均值或数学期望。 小结: E(X)反映随机变量X的统计平均性质,代表随机变量取值的一般水平或集中的位置,略去了随机变量概率分布规律的具体细节。 方差(variance) 设随机变量X的均值为E(X),则: 对于离散型随机变量X,其方差为: 对于连续型随机变量X,其方差为: 计算D(X)的简单公式: 小结: D(X)反映随机变量X的相对于均值E(X)的偏离程度,代表随机变量取值的分散性,也是统计平均的性质。 正态分布(Normal distribution) 设随机变量X的概率密度为: 其中-??+ ?,?0均为常数。称X服从参数为?,?的正态分布,记作X~N(?,?2). ?:均值; ?:方差 ?=0; ?2=1时,称为标准正态分布,记为X~N(0,1)。 遵从正态分布的随机变量X,其正态分布函数为: 正态分布的若干性质 正态分布完全由其均值?和方差?2决定; 正态分布的概率密度函数曲线呈对称的“钟形”; 经验规则(3 ?准则): 68% 95% 99% ?+? ?+2? ?+3? ?-? ?-2? ?-3? ? p(x) x 3. 总体和样本 总体X (population) 研究对象的某种特征值的全体组成的集合。用X表示。 样本X1, X2, …, Xn (sample) 在总体中选取部分有代表性的子集称为(随机)样本。 一个样本是来自总体X的一组相互独立同X分布的随机变
您可能关注的文档
- 【创新设计】2012届高中历史一轮复习1-1-1古代中国的政治制度配套课件.ppt
- 【创新设计】2012届高中历史一轮复习1-2-1古代希腊罗马的政治制度配套课件.ppt
- 【创新设计】2012届高中历史一轮复习1-1-2从汉至元政治制度的演变及明清君主专制的加强配套课件.ppt
- 【创新设计】2012届高中历史一轮复习1-3-1近代西方资本主义政治制度的确立与发展配套课件.ppt
- 【创新设计】2012届高中历史一轮复习1-2-2罗马法的起源与发展配套课件.ppt
- 【创新设计】2012届高中历史一轮复习2-1-2古代商业的发展和古代的经济政策配套课件.ppt
- 【创新设计】2013-2014学年高中地理必修三第三单元第三节课时1我国水资源的区域分布和南水北调的工程方案.ppt
- 【创新设计】2013-2014学年高中地理必修三第三单元第二节课时1鲁尔区发展的背景和发展过程中遇到的问题.ppt
- 【创新设计】2013-2014学年高中物理(粤教版)选修3-1:专题突破2-2电路的测量.ppt
- 【创新设计】2013-2014学年高中物理鲁科版选修1-1第1章1-4趋利避害——静电的利用与防止.ppt
- 2022-2023学年下学期七年级期末考试英语模拟卷(连云港专用)(原卷版).docx
- 江苏省泰兴市2021-2022学年八年级下学期期末英语试题(原卷版).docx
- 外研版英语2021-2022学年八年级下册期末复习卷四(含听力)(解析版).docx
- 2023年中考二轮小题必刷12 定语从句(原卷版).docx
- 精品解析:河北省唐山市路南区2021-2022学年七年级下学期期末英语试卷(原卷版).docx
- 期末考点大串讲-重点句子(解析版).docx
- 期末复习Unit 5-Unit 6 Grammar 语法专项练习2022-2023学年牛津译林版七年级英语下册.docx
- 2023暑假作业 第03练 频度副词(解析版).docx
- 2023暑假作业 第05练 祈使句(解析版).docx
- 专题11.阅读回答问题(期末真题精练精析)(解析版).docx
文档评论(0)