- 1、本文档共53页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
朴素贝叶斯方法
四、算例 系统控制中的应用 根据贝叶斯公式,则一号空情雷达报告目标类型为A的条件下,实际目标类型为A、B、C、D的条件概率分别为: * 知识管理与数据分析实验室 * 表示传感器报告目标为类型A的条件下,实际目标为A的概率; 表示实际目标类型为A的条件下,传感器报告目标类型为A的概率;P(A)表示存在类型为A的目标的先验概率; 表示所有传感器报告目标类型为A的概率之和,即 。 四、算例 系统控制中的应用 同样可以计算出一号空情雷达报告类型分别为B、C、D的条件下,实际目标类型的条件概率,如下表所示: * 知识管理与数据分析实验室 * 雷达报告 A B C D A 0.460 0.380 0.096 0.048 B 0.039 0.860 0.026 0.066 C 0.020 0.313 0.375 0.099 D 0.036 0.119 0.238 0.833 实际类型 四、算例 系统控制中的应用 于是,一号空情雷达报告假设目标类型为A的可信度为: 同理可以得到第一号传感器报告假设目标类型为B、C、D的可信度,即 : * 知识管理与数据分析实验室 * 为了提高探测的准确性,一般要设置一个可信度阈值 ,将计算出的可信度值与可信度阈值 比较,看目标识别的可信度是否达到要求。假设 ,则以上的可信度值没有一个达到要求,因此需要重新进行识别,将以上计算的可信度值作为下一次计算的先验概率。 四、算例 系统控制中的应用 现略去计算步骤,可得到基于两个传感器报告的目标类型为A、B、C、D的可信度为: 。 同样假设 ,则可以知道B的可信度大于阈值,则可判定,空中目标类型为B。 * 知识管理与数据分析实验室 * 四、算例 信息检索中的应用 贝叶斯网络检索模型可以计算术语与术语,术语与文档之间的条件概率。下图给出了一种贝叶斯网络检索模型,利用同义词对查询术语进行扩展,用于信息检索领域。 * 知识管理与数据分析实验室 * Q T2 T3 T4 T5 R1 R2 R3 R4 R5 D1 T1 D2 四、算例 信息检索中的应用 假设有文档集合d表示为 ;这些文档的索引术语集合r表示为 。右图即为贝叶斯网络模型扩展的拓扑结构,其中Q被定义为查询术语节点, 定义为文档节点, 定义为索引术语节点, 有一条指向被它索引的文档 的弧。 * 知识管理与数据分析实验室 * Q T2 T3 T4 T5 R1 R2 R3 R4 R5 D1 T1 D2 四、算例 信息检索中的应用 用两个术语层来挖掘文档索引术语之间的关系,完全复制初始术语节点层r,得到另一个属于节点层t。对于查询术语Q,在索引术语层t查找他的同义词 ,则从Q 到 有一条弧; 从 指向 的弧,就是从 指向 ,其中总有从 指向 的弧, 是在一定衡量方法 * 知识管理与数据分析实验室 * Q T2 T3 T4 T5 R1 R2 R3 R4 R5 D1 T1 D2 下与 最相关的术语集合。 四、算例 信息检索中的应用 在确定了贝叶斯网络模型之后,通过计算索引术语与术语之间、索引术语与文档之间的条件概率与文档节点的后验概率,就能够获得全部文档节点的概率,并根据概率大小排序获得与查询节点最匹配的检索结果。 * 知识管理与数据分析实验室 * 四、算例 信息检索中的应用 考虑一种更简单的情况,即在查询节点和文档节点以外,只有一层术语节点的简单贝叶斯网络检索模型,如右图所示。 * 知识管理与数据分析实验室 * Q T2 T3 T4 T5 D1 T1 D2 D3 T6 四、算例 信息检索中的应用 例4.2 如图4-3所示,假设查询节点为Q,术语节点集合为 ,文档节点集合为 。根据图中弧线所对应的关系,计算查询节点Q更接近于文档节点集合中的哪一个? 要求查询节点 更接近哪一个文档节点,即分别求 ,选择其中概率值最大的文档节点为所求。 * 知识管理与数据分析实验室 * 四、算例 信息检索中的应用 根据朴素贝叶斯算法的原则,所有术语节点相互独立。且由图可知,除去查询节点层,所有术语节点均为根节点。所以定义每一个术语 相关的先验概率 ,则不相关的概率 ,其中M为集合中术语的数目(本例中M=6)。一般情况下,任意
您可能关注的文档
- 时间轴与帧.ppt
- 智能中子土壤水分仪使用说明.doc
- 智能化系统工程初步设计及概算编制招标文件.doc-深圳市职业病防治院.doc
- 智慧城市技术与应用博览会调研报告-中国智慧城市.ppt
- 晨喝水与晚泡脚.ppt
- 普通话广州话.ppt
- 智慧校园-用户手册-南京邮电大学.doc
- 智能数字(光柱)显示报警仪表.doc.doc
- 暨南大学.doc
- 曲线积分.ppt
- 2025至2030年中国泥水刷数据监测研究报告.docx
- 圆与正多边形 单元综合检测(难点)-2024-2025学年沪教版九年级数学下册同步训练(含答案).pdf
- 2025至2030年中国洗面奶包装瓶数据监测研究报告.docx
- 2025至2030年中国洗涤灵数据监测研究报告.docx
- 2025至2030年中国洗衣机注塑模具数据监测研究报告.docx
- 2025至2030年中国洗刷木棉块数据监测研究报告.docx
- 2025至2030年中国活动式三孔钻座数据监测研究报告.docx
- 圆与正多边形 单元综合检测(重点)-2024-2025学年沪教版九年级数学下册同步训练(含答案).pdf
- 2025至2030年大距离超声波传感器项目投资价值分析报告.docx
- 2025至2030年复合亚克历板项目投资价值分析报告.docx
文档评论(0)