[工学]3 概率密度函数的估计.ppt

下载文档 降价啦

12
0
约3.75千字
约 49页
2018-02-19 发布于浙江
举报
版权申诉
保障服务

[工学]3 概率密度函数的估计.ppt

1、本文档共49页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

[工学]3 概率密度函数的估计

第1章绪论第3章概率密度函数的估计 3.1 引言 3.2 最大似然估计 3.3 Bayes估计与Bayes学习 3.4 总体分布的非参数估计 3.1 引言进行贝叶斯决策的前提条件已知相关的概率分布先验概率可以较容易地进行估计重点是估计类条件概率密度两步贝叶斯决策利用样本估计先验概率和类条件概率依据估计量进行分类决策估计量的性能概率分布估计方法的分类依据参数与非参数估计概率密度函数的形式是否已知监督与非监督估计是否明确样本所属类别综合两种不同的分类角度概率密度函数估计的基本类型监督参数估计——样本所属的类别及类条件总体概率密度函数的形式为已知，而表征概率密度函数的某些参数是未知的非监督参数估计——已知总体概率密度函数的形式但未知样本所属类别，要求推断出概率密度函数的某些参数非参数估计——已知样本所属类别，但未知总体概率密度函数的形式，要求我们直接推断概率密度函数本身参数估计的几个基本概念统计量参数空间点估计、估计量和估计值 estimator estimation value 区间估计 3.2 最大似然估计先做几项基本假设：设定这些假设的目的分别处理C个独立的问题独立地按照概率密度抽取样本集，并用之去估计未知参数 3.3 Bayes估计和Bayes学习贝叶斯估计的步骤总结参数估计方法总结最大似然估计贝叶斯估计贝叶斯学习最大后验估计关于本章的讨论估计量性能标准样本有限非直接利用概率的分类方法图3.2 均值的贝叶斯学习过程示意图可见： 3.4 总体分布的非参数估计基本方法根据样本直接估计类概率密度函数的方法。 1. 出发点：基于事实，直方图累积 p(x)是概率密度函数。随机向量x落入区域R的概率P为，设从密度为p(x)的总体中独立抽取的样本x1,x2,…,xN。若 N个样本中有k个落入区域R中的概率最大，则：希望是X落入区域R中概率P的一个很好的估计。众数概率密度高的地方产生的样本多，利用样本累积估计真实概率密度非单点直接累积，加窗概率密度函数估计的基本方法 N个样本是从概率密度函数为的总体中独立抽取的，则 n 个样本中 k 个样本落入区域R 中的概率符合二项分布。类概率密度函数p(x)的估计：设p(x)连续，区域R足够小且体积为V ， p(x)在R中没有变化，x是R中的点。有得 —— x点概率密度的估计 2. 存在的两个问题 1）固定V ，样本数增多，则k/N以概率1收敛；但只能得到在某一体积V中的平均估计。 2）N固定，V趋于零，或发散到无穷大；没有意义。必须注意V、k、k/N 随N变化的趋势和极限，保持合理性。 3. 估计的步骤： * 构造一串包含x的区域R1，R2，…，RN，… * 对R1采用一个样本估计，对R2采用两个样本，…… * 假定VN是RN的体积，kN是落入RN内的样本数目，是 p(x)的第N次估计，有 4. 为保证估计合理性应满足的三个条件 1） 2） 3）使频率能依概率1收敛于p(x) 落入RN中的样本数始终是总数中的极小部分能代表x点的密度p(x) 5. 两种非参数估计法： Parzen窗法、 kN近邻估计法。 Parzen窗法 1．Parzen窗估计的基本概念设区域RN：d维超立方体，棱长：hN，则以原点为中心的超立方体当xi落入以x为中心，体积为VN的超立方体时：否则 * * 先验概率类条件概率（密度）估计的参数是确定（非随机）而未知的量样本集按类别分开，假定有 c 类，则可分成 c 个样本集，其中中的样本都是从概率密度为的总体中独立地抽取出来的类条件概率密度函数具有某种确定的函数形式；为表示同有关，记为假定中的样本不包含关于的任何信息，也就是说不同类别的参数在函数上是独立的，即中的样本只对提供有关的信息设：ωi类的类概率密度函数具有某种确定的函数形式； θ是该函数的一个未知参数或参数集。最大似然估计把θ当作确定的未知量进行估计。从ωi类中独立地抽取N个样本：似然函数称这N个样本的联合概率密度函数为相对于样本集 X 的θ的似然函数。 ——在参数θ 下观测到的样本集X 的