- 1、本文档共23页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析法(PCA)-阅读标记版
维度规约 主成分分析(PCA) 在模式识别种,一个常见的问题就是特征选择或特征提取,在理论上我们要选择与原始数据空间具有相同的维数。然而,我们希望设计一种变换使得数据集由维数较少的“有效”特征来表示。 主成分分析 主成分分析(或称主分量分析,principal component analysis)由皮尔逊(Pearson,1901)首先引入,后来被霍特林(Hotelling,1933)发展了。 在PCA中,我们感兴趣的是找到一个从原d维输入空间到新的k维空间的具有最小信息损失的映射 X在方向w上的投影为 X是一个列向量,W是一个列向量 主成分分析(PCA) 一、主成分的定义及导出 二、主成分的性质 三、从相关阵出发求主成分 一、主成分的定义及导出 设 为一个 维随机向量, Cov(x)为X各分量间的协方差为你n*n的一个矩阵 主成分是这样的 ,样本投影到 上之后被广泛散布,使得样本之间的差别变得最明显,即最大化方差。 设 希望在约束条件 (单位矩阵)下寻求向量 ,使 最大化 . 写成拉格朗日问题 现在关于 求导并令其等于0,得到 如果 是 的特征向量, 是对应的特征值,则上式是成立的 同时我们还得到 为了使方差最大,选择具有最大特征值的特征向量 ,因此,第一个主成分 是输入样本的协方差阵的具有最大特征值对应的特征向量 第二个主成分 也应该最大化方差,具有单位长度,并且与 正交 对于第二个主成分,我们有 关于w2求导并令其为0,我们有 上式两边乘以 其中 可知 ,并且可得 这表明w2应该是 的特征向量,具有第二大特征值 类似的,我们可以证明其它维被具有递减的特征值的特征向量给出 我们来看另一种推导: 如果我们建立一个矩阵C,其第i列是 的规范化的特征向量(C为正交矩阵),则 ,并且 其中, 是对角矩阵,其对角线元素是特征值 ,这称为 的谱分解 由于C是正交的,并且 ,我们在 的左右两边乘以 和 ,得到 我们知道如果 ,则 ,我们希望它等于一个对角矩阵,于是,可以令 在实践中,即使所有的特征值都大于0,我们知道,某些特征值对方差的影响很小,并且可以丢失,因此,我们考虑例如贡献90%以上方差的前k个主要成分,当 降序排列时,由前k个主要成分贡献的方差比例为 实践中,如果维是高度相关的,则只有很少一部分特征向量具有较大的特征值,k远比n小,并且可能得到很大的维度归约 总方差中属于主成分 的比例为 称为主成分 的贡献率。 第一主成分 的贡献率最大,表明它解释原始变量 的能力最强,而 的解释能力依次递减。 主成分分析的目的就是为了减少变量的个数,因而一般是不会使用所有 主成分的,忽略一些带有较小方差的主成分将不会给总方差带来大的影响。 前 个主成分的贡献率之和 称为主成分 的累计贡献率,它表明 解释 的能力。 通常取较小的 k ,使得累计贡献达到一个较高的百分比(如80%~90%)。此时, 可用来代替 ,从而达到降维的目的,而信息的损失却不多。 主成分分析的应用 在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平,其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释。 主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。 如果原始变量之间具有较高的相关性,则前面少数几个主成分的累计贡献率通常就能达到一个较高水平,也就是说,此时的累计贡献率通常较易得到满足。 主成分分析的困难之处主要在于要能够给出主成分的较好解释,所提取的主成分中如有一个主成分解释不了,整个主成分分析也就失败了。 支持向量机(补充讲义) 上节课,我们讨论了SVM的分类,这里简略地讨论如何将SVM推广到回归上 我们还是使用线性模
您可能关注的文档
最近下载
- 必威体育精装版石灰生产危险源辨识、风险分析资料.docx VIP
- 船体装配工培训.pptx
- 新版人教版七年级英语上册书面表达及范文.pptx
- 2023-2024学年山东省潍坊市九年级(上)期末物理试卷.docx
- 广东省广州市增城区2022-2023学年九年级上学期期末英语试题(答案).docx VIP
- 《审计基础》课程标准.pdf
- 2024-2025学年度南京市鼓楼区三年级语文第一学期期末真题模拟检测.docx
- 餐饮服务员岗位培训.pptx
- 寒假放假安全教育主题班会PPT.pptx VIP
- 沪教版(2024)七年级上册Unit 1 Friendship 语法 Grammar 特殊疑问句(含解析).docx VIP
文档评论(0)