6 贝叶斯网络学习.pptxVIP

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6贝叶斯网络学习ppt课件

从数据中学习贝叶斯网络 Anders L. Madsen HUGIN EXPERT A/S March 2012 大纲 贝叶斯网络的构建 参数学习 序列学习 结构学习 2 从数据中学习贝叶斯网络 贝叶斯网络包含了一个图形结构(DAG)和一组条件概率表(CPTs -参数) 贝叶斯网络的构建是作为一个劳动密集型知识获取工具 这种够构造可以是自动或半自动的(根据数据库中的案例和专家知识) 学习结构框架 学习一批概率事件 学习连续概率 3 学习一个贝叶斯网络 诱导结构的图形表示 数据和专家知识的融合 估算参量 数据和专家知识的融合 4 胸部诊所 呼吸短促(D)可能是由于肺结核(T)、肺癌(L)、支气管炎(B)引起,或者都不相关,也可能跟它们不止一个相关 近期去亚洲出差(A)增加了得肺结核的可能,而抽烟(S)对于肺癌和支气管炎是一种已知的危险因素 单一的胸部X光片(X)的结果并没有区分肺癌和肺结核,也不能够知道有没有呼吸困难A 5 参数估计 参数的学习是通过识别的CPTsP的贝叶斯网络N =(G,P) 理论思考,数据库案例,主观评估 CPTs建立在数据库的案例基础之上 数据库案例:D = { c1,…,cN } 一些案例中可能会有遗漏一些值 CPTs通过最大似然估计进行评估 n是Y=y在案例中的期望值 6 参数估计 近期去过亚洲患有肺结核的概率是多少? n(最近去过亚洲) = n(A = y) = 92, n(最近去过亚洲并且已患有肺结核) = n(A = y, T = y) = 5: 7 参数估计 优先的(领域专家)知识可以被利用 经验是已经观察到 pa(Xi ) = j 时间上的量级: 经验计算作为正数αj 0 也用于打开或者关闭这种学习模式 利用先验知识同时加速和引导学习有哪些信誉好的足球投注网站全局的最优值 当丢失一个标准值时就会利用期望值计算 包括参数不出现在数据中 8 期望最大化算法 EM算法是一种利用目前的估计值作为真值的迭代过程 重复 预计期望的计算 θ:n∗(W)=Eθ{n(W)|||D} 计算新的估计值θ: 直到满足迭代标准停止计算 算法的控制参数是: 根据经验计算初始化参数值 停止准则:满足公差标准及迭代的最大次数 9 质量模型 我们可以利用模型可能给出的数据进行质量检测数据: 这个质量检测不需要对复杂的模型进行解释,由于过度捏合也不用来进行模型的选择 EM算法停止计算标准: 10 AIC和BIC分数 AIC和BIC是将模型的复杂性考虑进去的质量评估 Akaike信息准则(AIC) d为模型中若干的自由参数 d的存在制约了模型的复杂性 贝叶斯信息准则的标准(BIC) d 为模型中若干的自由参数 −d/2 log(N) 限制了模型的复杂性 除非log(N) 2, AIC BIC 11 序列的学习 某些特定的结构,但是要有适应特别环境的可能性 循序渐进更新贝叶斯网络的任务 应用于不同的设置、模型不确定性、随着时间的推移等 CPTs更新基于插入和观察的传播 通常有许多遗漏值 12 渐消因子/经验值 已经观察到经验随时间pa(Xi ) = j变化的次数 (样本大小) 经验值为正数αj 0 也用于开始/结束学习 衰落的影响因素在一定程度上降低了过去的一些经验 衰弱因素是接近1的正数 Hugin渐消是根据 13 序列的学习 这样的分布假设可以进行独立改进: 整体独立性:二阶不确定度的变量是独立的 局部独立性:二阶不确定度不同来源配置也是独立的 样本量越大,二阶的不确定性就越小 14 结构的学习 这项任务是识别问题域实体之间的依赖关系 目的是为了构建一个简单的模型,但一个困难的任务是: 可能的空间结构不仅巨大而且只能近似: 许多不同的结构编码运用一组独立或者是相关的声明(等价类) 可能有隐藏的变量 15 结构的学习 贝叶斯网络的图表引发了一系列相关或者独立的说明 16 等价模型 M1和M2两个模型在统计上是等价的,当且仅当它们包含了同一套变量及共同样本时,并且通过它们提供连续不断的非统计组合 任何两个通过相同的一组变量的M1和M2模型,它们的图表对具有相同的骨架图和相同的v型结构来说是等价的 A→B→C 和 A←B←C 和 A←B→C 所有完整的模型 因此,我们无法区别 A→B→C和A←B←C和 A←B→C仅仅是基于数据 可以从A → B ← C区分 17 等价分类 一个等价分类类是具有相同的一组独立性质的一个最大系列集合 I, II, 和 III 代表了在独立与相关关系条件下的类似的序列 如果结构从数据中获得鉴定,来自相同等价类的Gi与 Gj 不能够被区分 18 结构的学习 结构学习算法: 1 独立执行测试 2 确定图表结构 3 识别对撞机 4 识别派生的方向

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档