- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
决策和效应理论
Anders L. Madsen
HUGIN EXPERT A/S
March 2012
概述
贝叶斯决策问题
决策理论
效用理论
2
贝叶斯决策问题
为了在不确定时支持推理,我们建立了贝叶斯网络—它是什么样的决策?
贝叶斯决策理论提供了评估和确定在不确定性下的决策思考的坚实的基础平台,
在这一战略中确定(最佳)的策略和计算预期效用
有限的记忆体的影响图增强了BN决策变量和实用功能
信息,选择,和偏好
3
贝叶斯决策问题
我们考虑有限的的平行决策问题(必须是连续的)
单一的决策者
不同的决策选择完全控制-反向观察。决定是一个可控变量
放松非遗忘的假设,在完善的召回影响图
不同类型的决定
干预的决定,这迫使一些变量状态的变化
非干预的决定,不影响模型的一部分
决策者的喜好指定一个数值范围 - 具有较高的实用价值的配置首选
决策者行为的效用最大化决定
4
决策
通过观察获得的证据和通过主观决定获得的证据有不同的涵义
使用贝叶斯定理,这反映了从症状到疾病的诊断推理模型可以构建
干预措施的影响只能按照因果联系的方向
这意味着(部分)边缘的方向是很重要的
5
决策变量
一个决策变量D有一些状况{D1……DN}代表决策选项
解决决策问题WRT的目标决定D是找到在D行动的最佳选择
对于每一个可能的观察,我们应该告诉决策者,她应该做些什么
一个政策δ是一个可能的观测映射到D的状态空间的DOM(四)
决策判断的最优准则是决策者的预期效用最大化
6
石油投机分子
石油投机分子必须决定要么钻或不drill.He的不确定是否该洞是干,湿,或浸泡。投机分子可能采取的地震探测,这将有助于确定该网站的地质结构。探测将提供一个封闭的反射模式(多油的迹象),开放模式(指示一些油),或弥漫性模式(几乎没有希望的石油)。
两个决定,两个随机变量和两个实用功能
变量状态空间
域(钻)= {不,是},DOM(油)= {干,湿,浸泡}
域(测试)= {不,是},DOM(地震)={弥漫性的,开放的,封闭}
7
石油投机分子 —— 概率
有网站结构的不确定性和适量油
概率分布P(油)=(0.5,0.3,0.2),P(地震|石油)
8
石油投机分子 —— 公共事业
测试的成本是10 K,而钻井成本是70K。 “钻井工具是270K,120和0的浸泡,干湿孔,分别。
两个实用的功能,成本U1(测试)和奖励U2(钻,油)
这里是有意义的使用在公用事业规模为1000欧元
9
石油投机分子策略
该解决方案是1strategyΔ= {δ测试,δDrill}两项政策:
10
效用理论
作出决定,因为他们可能以某种方式使用
应评估决策的基础上,usefulnessof其后果
作为一个公用事业规模提到一个共同的数值尺度衡量的用处
我们可能需要变换不同的费用,奖励等为决策者共同规模:
E.g.Cost=αT+βR+γM+ΔI
作为决策者,我们要最大限度地发挥预期效用
11
期望效用最大化
设A是选项A1决定。 。Am和H假定一个状态H1。 。 。 ,HN
假设我们有一些观测证据的形式
实用成果
行动的预期效用
预期效用最大化
12
扑克游戏的故事
在这个扑克游戏,每个玩家收到三张卡,允许两轮改变卡。在第一轮的FC,你可能会放弃任何从你的手中MH号的手卡的数量从扑克牌中得到更换。在第二轮SC的资深大律师,你可能会丢弃最两张牌。经过两轮的卡变化,我对我的对手手中的牌OH感兴趣。
谁拥有最好的牌BH?
13
扑克游戏网
14
一个DAG的推理手中的相对质量扑克
扑克的效用函数
让每个球员支付一美元的入口(和改变卡)的利害关系是如此。未来决定是否调用(成本1美元)或放弃(倍)。
你是第一个决定。如果你打电话,你的对手是被迫跟随(并支付1美元)。手最好的球员,收集所有四个美元。
15
扑克游戏
预期效用是1,所以我们叫EU -1。
16
扑克游戏
我们可能会代表决定在模型和实用功能
D是一个非干预的决定
17
总结
贝叶斯决策问题
决定和公用事业
贝叶斯决策问题的范例
18
更多信息请关注/网站
19
THANK YOU
文档评论(0)