博弈论导论笔记部分.docVIP

下载本文档

17
0
约3.21千字
约 11页
2017-03-26 发布于江苏
举报
版权申诉

博弈论导论笔记部分.doc

1、本文档共11页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论导论笔记部分

在所有社会中，人们的行为总是会相互影响的（合作、竞争）。术语“相互依赖性”，表示一个人的行为对另一个人的福利造成的影响，不管这种影响是正面的还是负面的。相互依赖的情形可称为“策略环境”，因为人们为了确定所采取的最优行动，必须考虑他周围的其他人会怎么行动。博弈论有助于你对这个社会是如何运行的问题做出评估。非合作博弈论在“非合作博弈”的框架内，我们可以将策略环境理解为通常字面上博弈（game）的含义。因为名词博弈意着这样一种环境，其中两个及以上的对手进行才智的比拼，因此游戏中必然存在这样的依赖性，也就是一方的最优行为取决于他所相信的对方会采取的行动。非合作博弈论区别于其他研究策略的理论框架的一个主要特征是：非合作的框架把所有人的行动都当成是个别行动（individual actions）。个别行动指的是一个人进行自主决策，而与这个策略环境中的其他人无关。这个理论框架并没有排除以个人限制另一个人的可能性；也并非与参与人进行群体决策的情况不相容。在群体决策的情况下，非合作理论模型要求理论学者规定如何做出决策的程序。这个程序包括了规定行为人如何就选择权进行谈判，其中可能有讨价还价（都视为个别行动）。事实上，其中的任何一个人所做出的每一个决定都可以模型化为个别行为。合同及合作博弈论在某些情况下，从所有决策都被看作是个别行动的思路抽离出来——也就是，跳出非合作博弈论模式，根本不将协商过程模型化，而单单将协商的结果看作是一个联合行动（joint action），这样反而对研究更有帮助。这种理论称为“合作博弈论”（cooperative game theory）。这本书将合同视为策略互动整体化的一个部分，因此，对合同的选择和执行要特别予以注意。将联合行动的概念纳入策略模型是一个简化装置，使得你可以刻画行为人之间就某些事情进行协商，但不用明确的将协商过程本身模型化。行为人如果就联合行动达成协定，将受其约束而采取相应行动，从这个意义上说，协商的目标可以认为是“可实时缔约（spot-contractible）的。 “博弈“的含义简而言之，博弈是策略环境的正式描述。因此，博弈论是研究相互依赖情形的正式的方法论。本书的前半部分强调了在策略互动中由理论所确定的三个主要矛盾（tensions）：（1）个别利益和集体利益之间的冲突，（2）策略不确定性，以及（3）无效率协调的阴影。制度有助于缓和这些矛盾。关于博弈的正式表述含有以下共同的要素： 1. 博弈的一组参与人； 2. 对于参与人可能采取行动的一个完整描述（即它们的可行行动集）； 3. 对于参与人采取行动时所知信息的描述； 4. 对于参与人的行为将如何导致博弈结果的规定； 5. 对于参与人对结果的偏好的定义。非合作博弈的数学描述有两种通常的形式：扩展型（extensive form）和标准（策略）型[normal (strategic) form]。我们可以用一个树状结构图来表示两个人之间的决策互动，这种树状结构由节点和分支组成，节点表示博弈过程中事件的发生点（比如参与人之一做出的决策），而分支表示参与人能够选择的不同行为方案。我们用实心圆来表示节点，并用连接节点的箭头来表示分支。一个适当构造而成的树状结构就称为“扩展型表述（extensive-form representation）。图2.4描述了博弈中所有参与人的行动及信息。节点a、b、c、d和e都称为决策点（decision nodes），因为参与人在博弈的这些节点上做出决策。其他节点（f , g , h , l , m和n）称为终止点（terminal nodes）; 它们表示为博弈的结果——博弈结束的地方。每一个终止点也同时对应于一条唯一的沿着决策树的路径，这是一条从初始点出发，沿着箭头的方向由各分支连接，贯穿整个决策树的决策路径。在扩展型中，路径和终止点之间有一一对应的关系。一般来说，我们用信息集来定义各参与人在博弈中的决策节点所拥有的信息。一个信息集描述的是那些用虚线互相连接的决策节点（意思参与人无法区分这些节点）。每一个决策点包含在某个信息集里，一个信息集可包含一个or多个决策节点，如：节点a的信息集就只包含一个节点，c和d 则包含在同一个信息集里。一个博弈中的每个信息集明确的描述了各参与人必须做出的不同决策。通常用数字来表述参与人的偏好排序时最简便的，这也称为得益（payoffs）或效用（utilities）。越大的回报数字意味着更为偏好的结果。在某些博弈中，一个参与人可能从无限多的行动中进行选择。定义：策略（strategy）是博弈中参与人的一组完整的相机的行动计划。 “完整的相机的计划”是对一个参与人行为的完整描述，它包含了这一个参