- 1、本文档共56页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大型工程决策-第三章 随机性决策问题与效用函数
第三章 随机性决策问题与效用函数 王仁超 天津大学 本章内容 §1 先验信息与主观概率 §2 效用函数 §3 贝叶斯分析 *§4 随机优势法 §1 先验信息与主观概率 先验信息:随机性决策问题特点:自然状态的不确定性引起后果的不确定性。为了进行科学决策,决策人在通过试验收集自然状态有关信息之前,根据自己的经验、主观估计自然状态的信息,称为先验信息,它是贝叶斯决策分析的基础。 主观概率与客观概率 决策人根据自己的经验所设定的自然状态发生的概率称为主观概率;通过随机试验所确定的自然状态发生概率称为客观概率。 先验分布:借助先验信息确定的主观概率分布,称为先验分布 主观设定先验分布的方法基础 二元关系:比较两个对象某一方面属性的关系。主观概率估计中,比较两个事件发生的可能性 二元关系假设: 连通性:A、B两个事件发生的似然性是可以比较的,且只有以下一种关系成立,即等可能A~B;A比B更可能A?B, B比A更可能A?B。 传递性: A、B、C三个事件,若A?B、B ? C,则A ? C 部分小于全体:设事件A?B,则事件B的发生似然性A ?B,如A为物价上涨8-10%,B为物价上涨8-12%,则事件B发生的可能性至少与A一样大。 主观设定先验分布的方法 概率盘——最为常用 区间法 相对似然法 直方图法 概率盘 区间法 1)把事件不确定量的区间划分为两部分,询问决策人事件发生在哪个区间可能性更大 2)然后减少可能性大的区间,直至两个区间等可能; 3)同样还可以对两个区间记一步划分,得到1/4和3/4的点对应的区间 **由于该方法误差积累,一般不再进一步划分 相对似然法 在事件的不确定量区间中,要求决策者首先确定“最可能”和“最不可能”的量,然后询问“最可能”量的可能性是“最不可能”量的可能性的几倍-相对似然性,再对其他量进行相对似然性估计,由此得到非正常先验密度曲线(密度积分不等于1,故非正常)。 例如,关于某产品明年的销售量,在1000~10000件之间,最可能是5000件,最不可能是9000件,最可能发生5000件的可能性是最不可能9000件的4倍,于是得到5000对9000的相对似然。继续问4000件与8000件的相对似然性。。。 直方图法 将某一事件的不确定量划分为若干区间,询问决策人各个区间发生的概率, §2 效用函数 价值与效用:在经济学以及随机决策问题中,很多研究表明,决策人对后果的判定不完全取决于后果价值,而是价值的一个对应值,这个对应值反映决策的偏好(preference),即效用是决策人对后果值的偏好的量化。 效用函数:当决策人的偏好满足一定的公理时,所有决策后果与效用的对应函数关系。 展望、抽奖与抽奖的确定当量 展望(prospect)或预期:决策的可能前景,它是各种后果与后果出现概率的组合,记为:P={p1,c1;p2,c2;p3,c3;…;pr,cr} 抽奖:决策树中由机会点和该机会点发出的若干机会枝的概率及其后果构成的图形,称为抽奖,若决策人认为某个后果C与抽奖L= {p1,c1;p2,c2;p3,c3;…;pr,cr}无差异,则称C为抽奖L的确定当量,抽奖和确定当量是确定效用函数的常用方法 效用的存在性公理 由Von Neumann和Morgenstern 上世纪40年代提出。 连通性:P上的优先关系是连通的; 传递性 替代性:若P1、P2、P3∈P,P1?P2且0<α <1, αP1+(1- α)P3 ? αP2+(1- α)P3,或 0< β <α<1, αP1+(1- α)P3 ? β P2+(1- β)P3 连续性(偏好的有界性)若P1、P2、P3∈P,P1?P2 ?P3,则存在0< β <α<1使αP1+(1- α)P3 ? β P2+(1- β)P3 效用函数的数学定义 集合P上的实值函数u,若它和P上的优先关系一致,即:若P1,P2∈P且P1 ?P2,当且仅当u(P1) u(P2)。 定理:若P上的优先关系满足公理1~4,则一定存在上述定义的效用函数。 基数效用与序数效用 基数是2、3.5、100.0等,定义在展望上的效用是基数效用,以上介绍的效用函数,为基数效用函数,基数效用的特点:既反映偏好的次序,也反映偏好强度。通常基数效用值在0-1之间 序数,第一、第二、第三等,定义在后果集上,只反映偏好的次序,而不反映偏好强度,不涉及随机性。 效用函数的构造方法-偏好诱导 确定当量法:给定两个后果c1、c2,通常是最差和最好的结果,假定其均以50%概率出现,问决策人确定当量c为多少,c~c1×0.5+c2×0.5;设U(c1)=0, U(c2)=1,则得到C对应效用为0.5,在c1和c之间和c和c2之间继续询问决策人,则可以得到若干效用值,拟和成曲线即为该决策人的效用函数。 效
文档评论(0)