概率统计基础ppt.pdf

下载文档

8
0
约 56页
2017-08-17 发布于河北
举报
版权申诉
保障服务

概率统计基础ppt.pdf

1、本文档共56页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

概率统计基础ppt.pdf

概率统计基础 ———最大似然估计、MAP和贝叶斯估计前言贝叶斯公式( 当类别只有两类时) 贝叶斯公式可用非正式的英语表示成贝叶斯公式表明，通过观测的值我们可将先验概率转换为后验概率即假设特征值已知的条件下类别属于的概率。我们称为关于的似然函数，或简称为 “似然(likelihood)”。注意到后验概率主要是由先验概率和似然函数的乘积所决定的，证据 (evidence) 因子可仅仅看成是一个标量因子。模式分类的途径在设计分类器时中，我们通过类条件概率密度和先验概率，利用贝叶斯规则来计算后验概率，然后通过最大后验概率来做出决策。不幸的是：在多数情况下，类条件概率和先验概率是不知道的。这样我们就需要寻找某种有效的方法，能用现有的信息设计出正确的分类器。而我们可以利用的信息有： ●有关模式识别问题的一些模糊而笼统的信息 ●一些设计样本(训练样本) ，这些样本是待分类的模式的一个特定的子集我们的解决办法是利用这些训练样本来估计问题中所涉及的先验概率和条件概率密度函数。并把这些估计的结果当作实际的先验概率和条件概率函数，然后再设计分类器。在典型的有监督模式识别问题中，估计先验概率通常是没有太大的困难。最大的困难在于估计类条件概率密度。但是，如果我们事先已经知道参数的个数，并且先验知识允许我们能够把类条件概率密度进行参数化，那么问题的难度就可以显著的降低。我们的要做的就是：假设类条件概率密度为某种含参数的概率密度分布函数，通过训练数据来估计该函数中的未知参数然后，参数估计后的概率密度函数作为类条件概率密度，利用贝叶斯决策进行分类。例如：我们可以正确的假设是一个多元正态分布，其均值为，协方差矩阵为 (这两个参数的具体值是未知的) 。这样，我们就把问题从估计完全未知的概率密度转化为估计参数和。中的所有未知参数可以写成向量的形式，称为参数向量，含有未知参数的概率密度函数可以表示为。参数估计方法 ●最大似然估计(Maximum Likelihood) ●假设：将待估计的参数看作确定的量，只是值未知 ●估计方式：将使得产生训练样本的概率的最大参数值作为这些参数的最佳估计 ●贝叶斯估计( 贝叶斯学习) ●假设将待估计的参数看作符合某种先验概率分布的随机变量 ●估计方式通过观察样本，将先验概率密度通过贝叶斯规则转化为后验概率密度最大似然估计的思想为了叙述最大似然原理的直观想法，先看一个例子例假设有外形完全相同的两个箱子，甲箱中有99个白球和1个黑球，乙箱中有99个黑球和1个白球，今随机地抽取一箱，并从中随机抽取一球，结果取得白球，问这球是从哪一个箱子中取出？析：不管是哪一个箱子，从箱子中任取一球都有两个可能的结果：A 表示取出白球，B表示取出黑球。如果我们取出的是甲箱，则A 发生的概率为0.99 ，而如果取出的是乙箱，则A 发生的概率为0.01 。现在一次试验中结果A 发生了，人们的第一印象就是：“此白球(A)最像从甲箱取出的”，或者说，应该认为试验条件对结果A 出现有利，从而可以推断这球是从甲箱中取出的。这个推断很符合人们的经验事实，这里“最像” 就是“最大似然”之意。最大似然估计的基本思想：最大似然估计是利用总体的概率密度或概