博弈行为中的演绎与归纳推理及其问题的论文.docVIP

下载本文档

4
0
约9.2千字
约 21页
2017-08-23 发布于北京
举报
版权申诉

博弈行为中的演绎与归纳推理及其问题的论文.doc

1、本文档共21页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈行为中的演绎与归纳推理及其问题的论文博弈行为中的演绎与归纳推理及其问题的论文【内容提要】博弈逻辑(game logic)是随着博弈论的迅速发展而形成的一个新的学科，它是一行动逻辑。博弈逻辑研究的是理性的人在互动行动中即博弈中的推理问题。在博弈行为中存在演绎推理和归纳推理。正如在传统逻辑中存在逻辑悖论一样，博弈逻辑中同样存在悖论或者“问题”。博弈参与人运用演绎推理时存在逆向归纳法悖论，而运用归纳推理时存在归纳是否有效的问题。【关键词】博弈逻辑/演绎推理与归纳推理/逆向归纳法悖论/归纳推理的合理性【正文】　　1　一种新的逻辑：博弈逻辑博弈论研究人类活动中的互动行为，在经济学中得到广泛的运用。在博弈论中，人类的所有活动，只要是互动行为，均可以看成是博弈行动。在此基础上，一种新的逻辑“博弈逻辑”(game logic)得以兴起，它是一种特殊的行动逻辑(action logic)。博弈论研究多个理性人在互动过程中如何选择自己的策略。理性的人是使自己的目标或得益最大化的人，在经济活动中理性的人即是使经济目标最大化的人——经济人。理性人如何使得自己的“得益”最大？关键是“推理”。博弈逻辑中存在着两种研究纲领。第一种研究纲领是结合模态逻辑系统，建立新的博弈逻辑系统。在这方面，日本筑波大学的金子守(mamoru kaneko)教授是这方面的权威。近几年，他在国际刊物上发表了大量有关博弈逻辑方面的论文。他不仅在模态逻辑系统的基础上建立了多个博弈逻辑(game logic)系统，而且，建立了与博弈逻辑密切相关的公共知识逻辑(common knowledge logic)系统。第二种研究纲领是研究博弈活动中的实际“推理问题”，许多博弈论专家在此方面做了大量的工作。对博弈逻辑做整体的分析不是这里的任务，本文的目的是简要论述博弈活动中的推理问题，属于第二种研究纲领。根据博弈论，人们在实际的博弈活动中涉及到两种推理：演绎推理与归纳推理。然而，正如传统逻辑中存在着悖论（演绎悖论和归纳悖论），在博弈逻辑中同样存在着悖论。　　2　博弈逻辑中的演绎推理与归纳推理博弈论有两个假定：第一，博弈参与人是理性的；第二，博弈参与人的得益不仅取决于自己的行动，同时取决于其他人的行动。每个理性的参与人在策略选取，使自己得益最大时，要充分考虑局中其他人的策略选取。同时，每个参与人知道其他参与人与他有同样的想法。在博弈中，“每个人是理性的”是公共知识(common knowledge)，它是每个参与人进行策略选择或者推理的前提。博弈参与人的推理表现在他对策略的选取上。决定参与人的策略选取一方面是博弈结构，另一方面是其他参与人的策略。博弈结构是不同策略组合下的支付函数或者得益函数。按照博弈的次序来分，博弈分动态与静态博弈；按照信息的分布来分，博弈分为完全信息与不完全信息博弈。在不同的博弈结构下，参与人所用的推理不同。根据参与人推理前提与结论之间的关系，在博弈中推理分为演绎推理和归纳推理。我们来分析博弈参与人是如何运用演绎推理与归纳推理的。 (1)静态博弈的演绎推理　让我们来分析典型的“囚徒博弈”的例子。警察抓到了两个共同偷窃的小偷，对他们进行单独关押。囚徒面临这样的“政策”：如果一方“招认”，供出自己与对方以前所做违法之事，而对方“不招认”，“招认”方将无罪释放，对方会被判重刑10年；如果双方都与警方合作，选择“招认”策略，各被判刑5年；而如果双方均“不招认”，因警察找不到其他证明他们以前违法的证据，只能对他们的小偷行为进行惩戒，各判刑1年。这两个小偷如何做出选择？囚徒困境的支付矩阵为：附图 “囚徒困境”是一个被广泛谈论和研究的博弈。在这个囚徒困境中，小偷的最终“得益”是当场释放还是被判刑（10年、5年、1年），不仅取决于该囚徒的决定，而且取决于另外的小偷的决定。在这个例子中，每个小偷都作这样的推理：如果对方“招认”，我“不招认”的结果是判刑10年，“招认”的结果是判刑5年； “招认”的结果好于“不招认”的结果此时，我应当选择“招认” 如果对方“不招认”，我“不招认的结果是判刑1年，“招认”的结果是当场释放；当场释放比判刑1年要好此时，我应当选择“招认” 因此，无论对方采取“招认”还是“不招认”，我最好的策略是“招认”。无论是甲，还是乙，他们均推理得出最好的策略是“招认”。双方均招认是“纳什均衡”——这是一个稳定的结果。在囚徒博弈中存在惟一的纳什均衡（注：纳什均衡，简单地说就是，一策略组合中，所有的参与者面临这样的一种情况：当其他人不改变策略时，他此时的策略是最好的；也就是说，此时如果他改变策略，他的支付将会降低。在纳什均衡点