非参数估计_KN近邻.ppt

下载文档 降价啦

7
0
约2.14千字
约 30页
2017-06-29 发布于湖北
举报
版权申诉
保障服务

非参数估计_KN近邻.ppt

1、本文档共30页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

非参数估计_KN近邻重点讲义

非参数估计-Kn近邻估计概率密度估计概率密度估计问题：概率密度估计非参数概率密度估计的核心思路：概率密度估计假设N个样本的集合概率密度估计假设p(x)是连续的，且R足够小使得p(x)在R内几乎没有变化。令R是包含样本点x的一个区域，其体积为V，设有N个训练样本，其中有k落在区域R中，则可对概率密度作出一个估计：如果要求窗口宽度的影响 KN近邻法作后验概率的估计由KN近邻估计知N个已知类别样本落入VN内为KN个样本的概率密度估计为： N个样本落入VN内有KN个，KN个样本内有Ki个样本属于ωi类则联合概率密度：根据Bayes公式可求出后验概率： K近邻分类准则：对于待分样本x，找出它的k个近邻，检查它的类别，把x归于样本最多的那个类别。 K近邻分类的错误率随K↑，Pk↓,最低的错误率为Bayes分类。谢谢观赏！ * 报告人：马振磊统计决策法 Bayes决策法参数估计法非参数估计法线性判别函数概率方法几何方法聚类分析非线性判别函数非参数估计最大似然估计和贝叶斯估计都属于参数化估计。要求待估计的类概率密度函数形式已知。在实际应用中，类概率密度函数形式已知的条件并不一定成立，特别是多峰的概率分布，用普通函数难以拟合，这就需要用非参数估计技术。非参数估计原理不需获取类类概率密度的函数形式，而是直接利用学习样本估计特征空间任意点的类概率密度的值。即直接由学习样本来设计分类器。非参数估计给定的样本集：估计概率分布：一个向量x落在区域R中的概率P为：因此，可以通过统计概率P来估计概率密度函数p(x) 是根据概率密度函数为p(x)的分布独立抽取得到的。那么，有k个样本落在区域R中的概率服从二项式定理： k 的期望值为：对P的估计：当时，估计是非常精确的对p(x) 在小区域内的平均值的估计非参数估计思路用已知类别的学习样本在特征空间X处出现的频度来近似即：其中：v为包含X点的区域 , k为n个样本中落入体积v的样本数。非参数估计故：表示单位体积内落入x点邻域的样本在总样本中的比例，可以用此来近似样本在X点处的类概率密值。非参数估计问题一若v固定，则当n增大时，只能表示平均概率，而不是点概率密度因此，为保证为点概率密度，必须有非参数估计问题二若样本数n固定，则当时，则会出现x邻域内不包含任何样本，得出的错误估计。解决方案考虑让v和k都随n的变化进行调整，即：非参数估计能够收敛到p(x)，那么必须满足：选择Vn 选择kn 非参数估计非参数估计基本方法非参数估计法 Parzen窗口法 Kn近邻法基本方法 Parzen窗口法：主动选择vn与n的关系，kn被动确定，指n个样本中落入区域v的样本数 kn近邻法：主动选择kn与n的关系， vn被动确定，指包含kn个样本的x邻域非参数估计 Kn近邻法 Parzen窗口法的估计效果取决于样本总数n及当n较小时，对较为敏感，即：较大容易产生平均误差，估计较平坦，反映不出总体分布的变化。较小容易产生噪声误差，大部分体积将是空的（即不包含样本），从而使估计不稳定。 Kn近邻法其原因是由于只与总样本数有关，即进行概率密度估计时，任何x点处的都是相同的一种合理的选择是对样本出现密度大的x处，可较小，而对样本密度较小的x处，则相对大一些，这就是近邻法。 Kn近邻法 Kn近邻法基本原理主动选择与n的关系，被动确定，即使得体积为样本密度的函数，而不是样本总数的函数。可选择，该条件可满足： a. b. c. Kn近邻法近邻法，有效地解决了Parzen窗口法存在的问题，对平均误差和噪声性误差均有较好的改善选择后，如何计算？ Kn近邻法为与x点相邻的个近邻样本中，与x距离最远的样本所构成的区域，即 Kn近邻法用Kn近邻法设计分类器的过程：获取n个学习样本令找到待识样本X处的Kn个近邻计算Kn 个邻近到X的距离，找到最远距离的样本计算邻域的直径，计算邻域的体积 Kn近邻法