- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
LLE(局部线性嵌入)
LLE
杨浩
LLE的背景意义
传统的降维方法主要有PCA、LDA。PCA的基本思想是通过线性变换寻找一组最优的基,来重构原始数据样本,以使重构后的样本与原始样本误差最小。LDA是以样本的可区分性为主要目标,通过线性变换以达到类内的散度最小,类间的散度最大的目的。但是当数据集在高维空间呈现高度扭曲时,它们很难发现嵌入在数据集中的非线性结构和恢复内在结构。
LLE算法
LLE算法是是流形学习的一种。流形学习方法提供了一种新的研究途径,它能够对数据集中高维数据空间进行非线性降维,揭示其中的流形分布。LLE是属于流形学习的一种。
一个流形降维的过程如下图:
LLE的算法思想
LLE首先假设数据在较小的局部是线性的,也就是说一个数据可以由它邻域的几个样本来线性表示。
假设有样本 ,我们在该样本的原始邻域中用K近邻的思想找到其中的K个样本 ,假设 可以由 线性表示,即:
其中, 为权重系数,我们通过LLE降维后,希望 在低维空间对应的投影 和 对应的投影 也尽量保持同样的线性关系,即:
从上面看出,线性关系只在样本附近起作用,离样本远的样本对局部样本的线性关系没有影响,大大降低了降维的难度。
LLE的推导
对于LLE,首先需要确定邻域的大小,即需要多少的邻域样本来线性表示某个样本。假设这个值为K,我们可以通过欧式距离来选择样本点的K个邻居。
找到K个邻近样本后,需要找到 与K个样本点的线性关系,也就是找到线性关系中的权重系数。因此我们可以通过回归来求权重系数。假设我们有N个D维样本 我们用均方差来定义损失函数:
为了后面计算方便,先对系数进行归一化限制,即有
LLE算法推导
令
则
为 的局部协方差矩阵 , 为 的局部重建权值
LLE的算法推导
因此,我们最终的目的是使得 取得最小值情况下
的值。
又因为: 可以化简为
根据约束条件,可以用拉格朗日乘子法:
LLE算法推导
对W求导并令其值为0 ,求得 : (1)
前面已知 ,则
连立(1)式得解得:
因为 ,因此可以根据上述公式,迭代K个近邻数据点,依次可以求得 ,然后在
迭代所有的数据点,求得W的权重矩阵。
LLE算法推导
得到权重矩阵后,将原始的数据映射到低维空间中。映射的条件满足:
此时,权重系数我们上一步已经求得,要求得满足最小损失函数条件下的数据 ,而且满足以下条件:
(1)
其中, 是单位矩阵
LLE算法推导
令
结合上述约束条件:
根据拉格朗日乘子法有:
对Y进行求导令其为0,得:
根据矩阵特征值得定义:
设A为n阶矩阵,若存在常数 和n维 非零向量, 使得
则 为A的一个特征值, 为 对应的特征向量。
因此, 为M矩阵的特征向量组成的矩阵。
将 带入到
得:
即:
若要求 最小,则 最小,即取M的最小特征值。
SLLE
传统的LLE在第一步时根据样本点间欧式距离来寻找k个近邻点,而SLLE在处理这一步增加了样本的类别的信息,SLLE算法的其余步骤与LLE相同。
SLLE在
文档评论(0)