- 1、本文档共69页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章最大似然估计
第三章:最大似然估计 贝叶斯参数估计 介绍 贝叶斯框架下的数据收集 在以下条件下我们可以设计一个可选择的分类器 : P(?i) (先验) P(x | ?i) (类条件密度) 不幸的是,我们极少能够完整的得到这些信息! 从一个传统的样本中设计一个分类器 先验估计不成问题 样本对于类条件密度估计太小了 (特征空间维数太大了!) 这个问题的一个先验信息 P(x | ?i)的正态性 P(x | ?i) ~ N( ?i, ?i) 用两个参数标示 估计 最大似然估计 (ML) 和贝叶斯估计 结果近似于独立, 但是方法是不同的 最大似然估计中的参数是固定的但是未知! 通过最大化所观察的样本概率得到最优的参数 贝叶斯方法把参数当成服从已知分布的随机变量 在这两种方法中,我们用P(?i | x)表示分类规则! 最大似然估计 当样本数目增加时,收敛性质会更好 比其他可选择的技术更加简单 一般的原理 假设有c类并且 P(x | ?j) ~ N( ?j, ?j) P(x | ?j) ? P (x | ?j, ?j) 当: 使用训练样本提供的信息估计 ? = (?1, ?2, …, ?c), 每个 ?i (i = 1, 2, …, c) 和每一类相关 假定D包括n个样本, x1, x2,…, xn ?的最大似然估计是通过定义最大化P(D | ?)的值 “?值与实际观察中的训练样本最相符” 最优估计 令? = (?1, ?2, …, ?p)t 并令 ?? 为梯度算子 the gradient operator 我们定义 l(?) 为对数似然方程 l(?) = ln P(D | ?) 新问题陈述: 定义 ? 为使对数似然最大的值 最优值所需要满足的条件如下: 特殊情况的例子: 未知 ? P(xi | ?) ~ N(?, ?) (样本从一组多变量正态分布中提取) ? = ?,因此: ?的最大似然估计必须满足: 乘 ? 并且重新排序, 我们得到: 即训练样本的算术平均值! 结论: 如果P(xk | ?j) (j = 1, 2, …, c)被假定为d维特征空间中的高斯分布; 然后我们能够估计向量 ? = (?1, ?2, …, ?c)t 从而得到最优分类! 最大似然估计: 高斯例子: 未知 ? 和 ? ? = (?1, ?2) = (?, ?2) 最后得到: 合并 (1) 和 (2), 得到如下方程: 偏差 ?2的最大似然估计是有偏的 ?的一个基本的无偏估计是: 附录: ML 问题陈述 令 D = {x1, x2, …, xn} P(x1,…, xn | ?) = ?1,nP(xk | ?); |D| = n 我们的目标是终结 (?的值使得这个样本变得最有代表性!) 问题:找到 ? = (?1, ?2, …, ?c) 使得: 贝叶斯估计 (模式分类问题的贝叶斯) 在最大似然估计中 ? 被假定为固定值 在贝叶斯估计中 ? 是随机变量 后验概率 P(?i | x)的计算取决于贝叶斯分类的中心 目标: 计算 P(?i | x, D) 假设样本为D,贝叶斯方程可以写成 : 为了证明以上方程, 使用: 贝叶斯参数估计: 高斯过程 目标: 使用后验密度P(? | D) 估计 ? 普遍情况: P(? | D) ? 是唯一未知参数 (?0 与 ?0 未知!) 复制密度 将 (1) 与 (2)相加得到: 一种普遍的情况 P(x | D) 计算得到P(? | D) P(x | D) 仍然需要计算得到! 由此可得: (期望得到的分类条件密度P(x | Dj, ?j)) 因此: 已知P(x | Dj, ?j) 和 P(?j) 使用贝叶斯公式,我们得到贝叶斯分类准则: 贝叶斯参数估计:一般规则 P(x | D) 的计算可应用于所有能参数化未知密度的情况中,基本假设如下: 假定 P(x | ?) 的形式未知,但是?的值并不明确知道 ?被假定为满足一个已知的先验密度 P(?) 除此以外, ? 包含在集合D中,其中D是由n维随机变量x1, x2, …, xn 表示的P(x)组成的集合 基本的问题是: “计算先验密度P(? | D)” 然后 “推导出 P(x | D)” 使用贝叶斯方程,我们得到: 然后由独立性假设: 维数问题 问题包括50或100个特征 (二进制) 分类精度取决于维数和训练样本的数量 有相同系数的两组多维向量情况 如果特征是独立的,则有:
您可能关注的文档
- 第1章-自然坐标系.ppt
- 第1章-1.1.2-第1课时.ppt
- 第1章-数值计算中的误差.ppt
- 第1章-质点运动学2014.ppt
- 第1章1加工界面认识.pptx
- 第1章-量子力学进展 西南大学量子力学PPT(考试必备).ppt
- 第1章 计算机网络分类、性能指标、OSI、TCPIP模型3.ppt
- 第1章 电火花加工.ppt
- 第1章51单片机结构-汪媛.ppt
- 第1章之等效电路.ppt
- 2025年五年级信息技术下册全册教案.doc
- 2025年内部竞聘操作全套表格.doc
- 2025年人美版一年级美术上册教案全册.doc
- 2025年上海市第十八届初中物理竞赛复赛试题及答案大同中学杯.doc
- 2025年六年级全册心理健康教案116课.doc
- 重庆市重点校联考(含重庆市第八中学校)2024-2025学年高三下学期2月月考历史试卷.docx
- 2025年前25题5月企业培训师二级真题.doc
- 2025年商务礼仪南开大学远程在线作业答案.docx
- 2025年全国通用高中英语必修二Unit3TheInternet知识点归纳超级精简版.docx
- 2025年人教版小学四年级语文上册基础知识复习试题全册.doc
文档评论(0)