- 1、本文档共64页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 主成分分析
§7.1 引言
§7.2 总体的主成分
§7.3 样本的主成分
1
§7.1 引言
主成分分析(principal component analysis)由皮尔逊(Pearson,1901)首先引入,后来被霍特林(Hotelling,1933)发展了。
主成分分析是一种通过降维技术把多个变量化为少数几个主成分(综合变量)的统计分析方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。
2
习题7.6 下表给出的是美国50个州每100 000个人中七种犯罪的比率数据。这七种犯罪是:
x1:杀人罪 x5 :夜盗罪
x2:强奸罪 x6 :偷盗罪
x3:抢劫罪 x7 :汽车犯罪
x4:斗殴罪
试图用降维的方式对50个州的犯罪情况进行比较分析。
3
4
state
x1
x2
x3
x4
x5
x6
x7
Alabama
14.2
25.2
96.8
278.3
1135.5
1881.9
280.7
Alaska
10.8
51.6
96.8
284
1331.7
3369.8
753.3
Arizona
9.5
34.2
138.2
312.3
2346.1
4467.4
439.5
Arkansas
8.8
27.6
83.2
203.4
972.6
1862.1
183.4
California
11.5
49.4
287
358
2139.4
3499.8
663.5
Colorado
6.3
42
170.7
292.9
1935.2
3903.2
477.1
Connecticut
4.2
16.8
129.5
131.8
1346
2620.7
593.2
Delaware
6
24.9
157
194.2
1682.6
3678.4
467
Florida
10.2
39.6
187.9
449.1
1859.9
3840.5
351.4
Georgia
11.7
31.1
140.5
256.5
1351.1
2170.2
297.9
Hawaii
7.2
25.5
128
64.1
1911.5
3920.4
489.4
Idaho
5.5
19.4
39.6
172.5
1050.8
2599.6
237.6
Illinois
9.9
21.8
211.3
209
1085
2828.5
528.6
Indiana
7.4
26.5
123.2
153.5
1086.2
2498.7
377.4
Iowa
2.3
10.6
41.2
89.8
812.5
2685.1
219.9
Kansas
6.6
22
100.7
180.5
1270.4
2739.3
244.3
Kentucky
10.1
19.1
81.1
123.3
872.2
1662.1
245.4
Louisiana
15.5
30.9
142.9
335.5
1165.5
2469.9
337.7
Maine
2.4
13.5
38.7
170
1253.1
2350.7
246.9
┆
┆
┆
┆
┆
┆
┆
┆
5
主成分的应用
(1)在一些应用中,这些主成分本身就是分析的目的,此时我们需要给(用来降维的前几个)主成分一个符合实际背景和意义的解释,以明白其大致的含义。
(2)在更多的另一些应用中,主成分只是要达到目的的一个中间结果(或步骤),而非目的本身。例如,将主成分用于聚类(主成分聚类)、回归(主成分回归)、评估正态性、寻找异常值,以及通过方差接近于零的主成分发现原始变量间的多重共线性关系等,此时的主成分可不必给出解释。
6
旋转公式:
7
图7.1.1 寻找主成分的正交旋转
§7.2 总体的主成分
一、主成分的定义及导出
二、主成分的性质
三、从相关阵出发求主成分
8
一、主成分的定义及导出
设 ,E(x)=μ,V(x)=Σ。考虑如下的线性变换
希望在约束条件 下寻求向量a1,使得 达到最大,y1就称为第一主成分。
设λ1≥ λ2≥?≥λp≥0为Σ的特征值, ,
i=1,2,?,p为相应的一组正交单位特征向量。则可求得第一主成分为
它的方差具有最大值λ1。
9
如果第一主成分所含信息不够多,还不足以代表原始的p个变量,则需考虑再使用 ,并要求
Cov(y1,y2) =0
我们在此条件和约束条件 下寻求向量a2,使得 达到最大,所求的y2称为第二主
您可能关注的文档
- 第8IP子网间的路由技术OSPF.ppt
- 第8单元第4讲含参数的不等式的问题.ppt
- 第8课苏联的经济改革.ppt
- 第8光盘驱动器和软盘驱动器.ppt
- 第8利润的最大化和竞争性供给.ppt
- 第8利润最大化和竞争性供给.ppt
- 第8流动资产管理.ppt
- 第8嵌入式系统开发平台.ppt
- 第8配合化合物.ppt
- 第8图像修饰工具的应用.ppt
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
最近下载
- 高同型半胱氨酸血症的诊断、治疗与预防专家共识.docx VIP
- 人教版高中英语必修第二册《UNIT 3 THE INTERNET》大单元整体教学设计.pdf
- 微型消防站工作职责(标准版).docx VIP
- 呼唤-快车上玩家地图1 plmap演示版.pdf
- 德邦零担业务诊断及新产品开发项目建议书-2014.pptx VIP
- 人教版高中英语必修第二册《UNIT 4 HISTORY AND TRADITIONS》大单元整体教学设计.docx
- 高同型半胱氨酸血症的诊断、治疗与预防.pptx VIP
- 附件2:汽车专访.pdf VIP
- 2024年食品安全生产经营大比武理论考试题库资料-下(多选、判断题汇总).pdf
- 快车上的恐怖旅行手册.pdf
文档评论(0)