- 1、本文档共72页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多 元 统 计 分 析(1)
题 目: 多元统计分析知识点
目录
第一章绪论 1
§1.1什么是多元统计分析 1
§1.2多元统计分析能解决哪些实际问题 2
§1.3主要内容安排 2
第二章多元正态分布 2
§2.1基本概念 2
§2.2多元正态分布的定义及基本性质 8
1.(多元正态分布)定义 9
2.多元正态变量的基本性质 10
§2.3多元正态分布的参数估计 11
1.多元样本的概念及表示法 12
2. 多元样本的数值特征 12
3.和 的最大似然估计及基本性质 15
4.Wishart分布 17
第五章 聚类分析 18
§5.1什么是聚类分析 18
§5.2距离和相似系数 19
1.Q—型聚类分析常用的距离和相似系数 20
2.R型聚类分析常用的距离和相似系数 25
§5.3八种系统聚类方法 26
1.最短距离法 27
2.最长距离法 30
3.中间距离法 32
4.重心法 35
5.类平均法 37
6.可变类平均法 38
7.可变法 38
8.离差平方和法(Word方法) 38
第六章判别分析 39
§6.1什么是判别分析 39
§6.2距离判别法 40
1、两个总体的距离判别法 40
2.多总体的距离判别法 45
§6.3费歇(Fisher)判别法 46
1.不等协方差矩阵两总体Fisher判别法 46
2.多总体费歇(Fisher)判别法 51
§6.4贝叶斯(Bayes)判别法 58
1.基本思想 58
2.多元正态总体的Bayes判别法 59
§6.5逐步判别法 61
1. 基本思想 61
2.引入和剔除变量所用的检验统计量 62
3.Bartlett近似公式 63
第一章绪论
§1.1什么是多元统计分析
在自然科学、社会科学以及经济领域中,常常需要同时观察多个指标。例如,要衡量一个地区的经济发展,需要观测的指标有:
总产值(X1)、利润(X2)、效益(X3)、劳动生产率(X4)、万元生产值能耗(X5)、固定资产(X6)、流动资金周转率(X7)、物价(X8)、信贷(X9)及税收(X10)也就是说一个地区的经济发展,受多种指标共同作用的影响,我们把每一个指标看成一个随机变量,可以单独研究每个随机变量,但这只能揭示该地区经济发展的一个方面,更多的时候需要把把这诸个随机变量一起研究揭示多个随机变量对该地区经济发展的共同影响,以及揭示这些随机变量内在变化规律。
例如,研究某公司的经营状况,需要观测公司的财务指标有:
每股净资产(X1)、净资产收益率(X2)、每股收益(X3)、每股现金流(X4)、负债率(X5)、流动比率(X6)及速动比率(X7)。可以单独研究每个随机变量,更多的时候需要把这诸个随机变量一起研究,揭示这些随机变量内在变化规律。
多元统计分析——研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。
多元统计分析包括的主要内容:多元(正态)总体的参数估计和假设检验、聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析、多重多元回归分析等。
介绍多元统计分析方法时,需要的时候增加一些线性代数的知识。
§1.2多元统计分析能解决哪些实际问题
⑴经济学:对我国32个省市自治区的社会情况进行分析。
⑵工业:服装厂生产服装。为了适应大多数顾客的需要,如何确定服装的主要指标及分类的型号。指标:身长、袖长、胸围、腰围、肩宽、肩厚等十几个指标(主要指标:长度、胖瘦)
⑶投资组合:
§1.3主要内容安排
多元(正态)总体的参数估计、聚类分析、判别分析、主成分分析、因子分析、典型相关分析等。上机操作。
第二章多元正态分布
§2.1基本概念
1.随机向量的概率分布
定义1 将p个随机变量的整体称为p维随机向量,记为
在多元统计分析中,仍然将所研究对象的全体称为总体。
一元总体分布函数和分别密度定义:
为随机变量X的概率分布,记为。
离散型:
k=1,2,3,…
⑴; ⑵
连续型:
; ⑵
定义2 设是p维随机向量,它的多元分别函数定义为
记为,其中记为。
定义3 设是p维随机向量,若存在有限个或可列个p维数向量,,,…,记 (k=1,2,3,…),且满足,,则称X为离散型随机向量,称(k=1,2,3,…)为的概率分布。
设p维随机向量,,若存在一个非负函数,使得对一切,有
则称X为连续随机向量,称为分布密度函数,易见
, ⑵
例1试证函数
为随机向量的密度函数。
证:(1)易见
(2)
定义4 设是p维随机向量,称由q(p)个分量组成的子向量的分布为的边缘(或边际)分布(通过变换中各分量的次序,总可以假定正好是的前q个分量,其余p-q个分量为),即,相应的取值也可以分成两部分。的边缘分布函数为
当有分布密度时,则的分布密度为
例2 对例1中的求边缘密度函数。
解:当时
当
文档评论(0)