- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
赵岩本科生博弈论
博弈论 赵 岩 博士 博弈的分类 模型中的基本变量 一个博弈模型要具备的基本要素 (1)参与人(players) (2)行动或策略(actions or strategy) (3)效用支付函数(paysoff) 现实世界中的社会困境 占优战略 纳什均衡 博弈的任何一方不能够单独改变战略来提高收益的一组战略组合被称为纳什均衡(Nash equilibrium)。 博弈论不能保证你赢 博弈论可以保证你输得不后悔 * 不完全信息动态博弈;;精炼贝叶斯纳什均衡; Selten(1975) 不完全信息 静态 博弈;贝叶斯纳什均衡; Harsanyi(1967-1968) 不完全信息 完全信息动态博弈;子博弈精炼纳什均衡 ;Selten(1965) 完全信息静态博弈;纳什均衡 Nash(1950,1951) 完全信息 动态 静态 分类和均衡 (1)现象模型化 (2)求解(均衡) (3)一般化解释 分析框架 囚徒困境(Tucker,1950):一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。检察官说:“你们的偷盗罪确凿,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。” 现象模型化 阿尔伯特·塔克(Albert Tucker,1905-1995) 出生于加拿大的安大略,1929年到普林斯顿大学从事研究工作,后成为普林斯顿大学的教师,并且担任数学系主任。当时,普林斯顿大学的数学系是世界上最富创造力的数学系之一。1950年,在为普林斯顿大学心里学家作报告时,塔克创造了囚徒困境。囚徒困境的例子虽然一页纸就可以写完,但却对20世纪后半叶的社会科学产生了极为重要的影响。塔克本人也因其在博弈论和数学优化领域的贡献而为世人所尊敬。 -1 -1 -8 0 0 -8 -5 -5 2 坦白 抵赖 1 坦白 抵赖 囚徒困境(Tucker,1950) 表示方法:开展式(Extensive Form);规范式(Normal Form) 请不要将囚徒困境看作是一个故事,而将它看作是一个“模型”。“模型”是隐喻现实的,因为很多现实问题可以套用模型去理解、分析和解释。 请寻找出现实世界中的社会困境? 中小学生“减负” 碳减排 公地悲剧 美苏军备竞赛 卡塔尔石油输出国组织 -1, -1 -8, 0 抵赖 0, -8 -5, -5 坦白 囚徒B 抵赖 坦白 囚徒A *
文档评论(0)