网站大量收购闲置独家精品文档,联系QQ:2885784924

朴素贝叶斯方法.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
朴素贝叶斯方法

四、算例 系统控制中的应用 根据贝叶斯公式,则一号空情雷达报告目标类型为A的条件下,实际目标类型为A、B、C、D的条件概率分别为: * 知识管理与数据分析实验室 * 表示传感器报告目标为类型A的条件下,实际目标为A的概率; 表示实际目标类型为A的条件下,传感器报告目标类型为A的概率;P(A)表示存在类型为A的目标的先验概率; 表示所有传感器报告目标类型为A的概率之和,即 。 四、算例 系统控制中的应用 同样可以计算出一号空情雷达报告类型分别为B、C、D的条件下,实际目标类型的条件概率,如下表所示: * 知识管理与数据分析实验室 * 雷达报告 A B C D A 0.460 0.380 0.096 0.048 B 0.039 0.860 0.026 0.066 C 0.020 0.313 0.375 0.099 D 0.036 0.119 0.238 0.833 实际类型 四、算例 系统控制中的应用 于是,一号空情雷达报告假设目标类型为A的可信度为: 同理可以得到第一号传感器报告假设目标类型为B、C、D的可信度,即 : * 知识管理与数据分析实验室 * 为了提高探测的准确性,一般要设置一个可信度阈值 ,将计算出的可信度值与可信度阈值 比较,看目标识别的可信度是否达到要求。假设 ,则以上的可信度值没有一个达到要求,因此需要重新进行识别,将以上计算的可信度值作为下一次计算的先验概率。 四、算例 系统控制中的应用 现略去计算步骤,可得到基于两个传感器报告的目标类型为A、B、C、D的可信度为: 。 同样假设 ,则可以知道B的可信度大于阈值,则可判定,空中目标类型为B。 * 知识管理与数据分析实验室 * 四、算例 信息检索中的应用 贝叶斯网络检索模型可以计算术语与术语,术语与文档之间的条件概率。下图给出了一种贝叶斯网络检索模型,利用同义词对查询术语进行扩展,用于信息检索领域。 * 知识管理与数据分析实验室 * Q T2 T3 T4 T5 R1 R2 R3 R4 R5 D1 T1 D2 四、算例 信息检索中的应用 假设有文档集合d表示为 ;这些文档的索引术语集合r表示为 。右图即为贝叶斯网络模型扩展的拓扑结构,其中Q被定义为查询术语节点, 定义为文档节点, 定义为索引术语节点, 有一条指向被它索引的文档 的弧。 * 知识管理与数据分析实验室 * Q T2 T3 T4 T5 R1 R2 R3 R4 R5 D1 T1 D2 四、算例 信息检索中的应用 用两个术语层来挖掘文档索引术语之间的关系,完全复制初始术语节点层r,得到另一个属于节点层t。对于查询术语Q,在索引术语层t查找他的同义词 ,则从Q 到 有一条弧; 从 指向 的弧,就是从 指向 ,其中总有从 指向 的弧, 是在一定衡量方法 * 知识管理与数据分析实验室 * Q T2 T3 T4 T5 R1 R2 R3 R4 R5 D1 T1 D2 下与 最相关的术语集合。 四、算例 信息检索中的应用 在确定了贝叶斯网络模型之后,通过计算索引术语与术语之间、索引术语与文档之间的条件概率与文档节点的后验概率,就能够获得全部文档节点的概率,并根据概率大小排序获得与查询节点最匹配的检索结果。 * 知识管理与数据分析实验室 * 四、算例 信息检索中的应用 考虑一种更简单的情况,即在查询节点和文档节点以外,只有一层术语节点的简单贝叶斯网络检索模型,如右图所示。 * 知识管理与数据分析实验室 * Q T2 T3 T4 T5 D1 T1 D2 D3 T6 四、算例 信息检索中的应用 例4.2 如图4-3所示,假设查询节点为Q,术语节点集合为 ,文档节点集合为 。根据图中弧线所对应的关系,计算查询节点Q更接近于文档节点集合中的哪一个? 要求查询节点 更接近哪一个文档节点,即分别求 ,选择其中概率值最大的文档节点为所求。 * 知识管理与数据分析实验室 * 四、算例 信息检索中的应用 根据朴素贝叶斯算法的原则,所有术语节点相互独立。且由图可知,除去查询节点层,所有术语节点均为根节点。所以定义每一个术语 相关的先验概率 ,则不相关的概率 ,其中M为集合中术语的数目(本例中M=6)。一般情况下,任意

文档评论(0)

daoqqzhuan2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档