第3章概率密度函数的估计试题.ppt

下载文档 降价啦

35
0
约3.59千字
约 41页
2017-02-28 发布于湖北
举报
版权申诉
保障服务

第3章概率密度函数的估计试题.ppt

1、本文档共41页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第3章概率密度函数的估计参数估计的基本概念正态分布的监督参数估计（最大似然估计）总体分布的非参数估计（Parzen窗法，K近邻法）分类器错误率的估计 3.1 引言未知，需要利用样本集来估计。 3.1 引言—由样本集估计参数估计监督、非监督（最大似然估计、贝叶斯估计）非参数估计 Parzen窗法、K近邻法 3.2 参数估计—基本概念统计量利用包含总体信息的样本构造的某种函数参数空间未知参数的全体容许值构成的集合称为参数空间。点估计、估计量、估计值点估计即利用统计量作为对参数的估计量，利用样本得到估计量的具体数值，称为估计值。区间估计用区间作为取值的范围的一种估计，该区间称为置信区间，这类估计称为区间估计。 3.2 参数估计—估计量的评价无偏性如果参数的估计量的数学期望等于，则称估计是无偏的。如果当样本趋于无穷时估计才具有无偏性，则称为渐进无偏。 3.2 参数估计—最大似然估计（监督）前提条件：（1）是确定而未知的；（2）样本所属类别已知，且是从各类总体中独立抽取的；（3）形式已知（如正态），但参数未知（如）（4）i类样本不影响j类信息。（类间独立，可分别研究C类问题） 3.2 参数估计—最大似然估计（监督）基本思想： 3.2 参数估计—最大似然估计（监督）计算过程： 3.2 参数估计—最大似然估计（监督）注意问题： 3.2 参数估计—最大似然估计（监督）（2）求极大值无解（例：均匀分布情况） 3.3 正态分布参数的最大似然估计（监督）一维情况 3.3 正态分布参数的最大似然估计（监督） 3.3 正态分布参数的最大似然估计（监督）多维推广： 3.3 正态分布参数的最大似然估计（监督）算例：有10个学生，其中5个男生，5个女生。取身高体重两个指标作为特征，有数据表 3.3 正态分布参数的最大似然估计（监督） 3.3 正态分布参数的最大似然估计（监督） 3.3 正态分布参数的最大似然估计（监督）贝叶斯估计简介非监督参数估计简介非监督最大似然估计需定义混合密度正态分布下的非监督参数估计混合高斯分布，利用EM（期望最大化）算法求解各密度分量参数。 3.4总体分布的非参数估计问题的提出参数估计：总体分布已知，参数为未知（监督、非监督）非参数估计：总体分布未知，直接由样本估计总体分布技术分类(依据体积的不同选取方法） 3.4总体分布的非参数估计 3.4总体分布的非参数估计—Parzen窗法假定R为以x为中心的d维超立方体，棱长为h，则体积为 3.4总体分布的非参数估计—Parzen窗法窗函数应满足的要求：窗函数的选择：除方窗外，还可选择正态窗、指数窗等 3.4总体分布的非参数估计—Parzen窗法 3.4总体分布的非参数估计—Parzen窗法 3.4总体分布的非参数估计—k近邻法问题的提出 Parzen窗法中窗宽（或体积）的选择较为困难。该式对初值敏感，初值太小，大部分体积是空的，密度估计不稳定，初值太大，估计的密度较平坦，无法反映真实分布，为解决此问题，产生了k近邻法。 3.4总体分布的非参数估计—k近邻法思想：x周围设一空胞，扩大至包含k个样本 3.4总体分布的非参数估计—k近邻法 k的选取 3.4总体分布的非参数估计—kN近邻法 3.4非参数估计举例—数字的Bayes分类 3.4非参数估计举例—数字的Bayes分类计算先验概率计算，再计算类条件概率密度 3.4非参数估计举例—数字的Bayes分类样本X的类条件概率利用Bayes公式求后验概率 3.4非参数估计举例—数字的Bayes分类 3.5分类器错误率的估计 3.5分类器错误率的估计已设计好分类器（样本均为考试样本） 1、未知——随机抽样从总体随机抽取N个样本检验分类器，假定错分数为，则错误率估值为 3.5分类器错误率的估计证明：每一样本有正确分类、错误分类两种情况，属于贝努利试验，N个样本为N重贝努利试验。设真实错分概率为已给定，则的分布服从二项分布。 3.5分类器错误率的估计 2、已知——选择性抽取 3.5分类器错误率的估计未设计好分类器的情况（样本即用于设计又用于检验） 3.5