网站大量收购闲置独家精品文档,联系QQ:2885784924

含非对称信息结构的远近程随机非零和博弈研究.pdfVIP

含非对称信息结构的远近程随机非零和博弈研究.pdf

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

在随机非零和博弈理论中,已有的研究多针对于含对称信息结构的随机非零和博

弈问题。考虑到在网络系统中,包含有远程参与者和近程参与者,且近程参与者到远

程参与者的信息传输过程中会产生丢包,导致远程参与者和近程参与者所获取的信息

不对称。关于此类含非对称信息结构的远近程随机非零和博弈问题研究较少,针对这

种非对称信息的情况,本文主要基于极大值原理方法和正交分解技术,研究了加性噪

声情形和乘性噪声情形下的开环和闭环远近程随机非零和博弈问题。

具体研究内容、研究结果和创新按照章节顺序叙述如下:

1.针对加性噪声情形下的开环和闭环远近程随机非零和博弈问题。首先,本文考

虑的是远近程随机非零和博弈,其中近程参与者和远程参与者所访问的信息集不一

致。其次,系统方程被建模为受加性噪声扰动的离散时间随机系统,性能指标被定义

为二次凸函数。一方面,依据凸变分的思想,建立了极大值原理,基于正倒向随机差

分方程的解,得到了最优开环纳什均衡存在的充分必要条件。另一方面,利用正交分

解方法,克服了博弈双方信息结构不一致带来的挑战,通过引入修正的耦合Riccati方

程,得到了最优闭环纳什均衡。最后,通过数值算例验证了加性噪声系统的远近程随

机非零和博弈的纳什均衡解的收敛性。

2.针对乘性噪声情形下的开环和闭环远近程随机非零和博弈问题。乘性噪声情形

的远近程随机非零和博弈研究具有挑战性。由于乘性噪声具有非高斯属性,会使线性

系统具有一定的非线性特性,导致远近程随机非零和博弈问题难以求解。首先借助极

大值原理方法,通过解耦正倒向随机差分方程,导出了开环纳什均衡。其次,利用条

件数学期望的性质,设计了最优状态估计器。进一步利用正交分解方法,结合完全平

方技术,通过解耦Riccati方程,得到了最优的闭环纳什均衡策略。最后,通过仿真算

例验证了理论结果的有效性,并讨论了对更复杂系统的潜在扩展。

主要学术创新点包括:针对于加性噪声情形的非对称信息结构的开环和闭环远近

程随机非零和博弈问题,信息结构的不一致性导致传统的方法失效。本文所用的方法

是基于正交分解法和完全平方技术,利用一组耦合的Riccati方程的解,给出了最优闭

环纳什均衡策略。针对于乘性噪声情形下的远近程随机非零和博弈问题,克服了乘性

噪声系统带来的挑战,利用正交分解方法和完全平方方法,借助一组Riccati方程的

解,得到了纳什均衡的反馈显式解析形式。

关关关键键键词词词:::非非非对对对称称称信信信息息息结结结构构构;;;非非非零零零和和和博博博弈弈弈;;;极极极大大大值值值原原原理理理;;;正正正交交交分分分解解解方方方法法法;;;开开开环环环和和和闭闭闭环环环

纳纳纳什什什均均均衡衡衡

Abstract

Inthetheoryofstochasticnonzero-sumgame,theexistingresearchmainlyfocusedon

stochasticnonzero-sumgamewithsymmetricinformationstructure.Consideringthatinthe

networkedsystem,thedecisionmakersarethelocalplayerandtheremoteplayerrespectively,

andpacketlosswilloccurintheinformationtransmission,resultinginasymmetricinformation

obtainedbythelocalplayerandtheremoteplayer.Thereislittleresearchonthelocaland

remotestochasticnonzero-sumgamewithasymmetricinformationstructure.Inthisthesis,

basedonthemaximumprinciplemethodandorthogonaldecompositiontechnology,theopen-

loopandclosed-looplocalan

您可能关注的文档

文档评论(0)

论文资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档