含非对称信息结构的远近程随机非零和博弈研究.pdfVIP

下载本文档

0
0
约12.82万字
约 59页
2025-02-08 发布于江西
举报
版权申诉

含非对称信息结构的远近程随机非零和博弈研究.pdf

1、本文档共59页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要

在随机非零和博弈理论中，已有的研究多针对于含对称信息结构的随机非零和博

弈问题。考虑到在网络系统中，包含有远程参与者和近程参与者，且近程参与者到远

程参与者的信息传输过程中会产生丢包，导致远程参与者和近程参与者所获取的信息

不对称。关于此类含非对称信息结构的远近程随机非零和博弈问题研究较少，针对这

种非对称信息的情况，本文主要基于极大值原理方法和正交分解技术，研究了加性噪

声情形和乘性噪声情形下的开环和闭环远近程随机非零和博弈问题。

具体研究内容、研究结果和创新按照章节顺序叙述如下：

1.针对加性噪声情形下的开环和闭环远近程随机非零和博弈问题。首先，本文考

虑的是远近程随机非零和博弈，其中近程参与者和远程参与者所访问的信息集不一

致。其次，系统方程被建模为受加性噪声扰动的离散时间随机系统，性能指标被定义

为二次凸函数。一方面，依据凸变分的思想，建立了极大值原理，基于正倒向随机差

分方程的解，得到了最优开环纳什均衡存在的充分必要条件。另一方面，利用正交分

解方法，克服了博弈双方信息结构不一致带来的挑战，通过引入修正的耦合Riccati方

程，得到了最优闭环纳什均衡。最后，通过数值算例验证了加性噪声系统的远近程随

机非零和博弈的纳什均衡解的收敛性。

2.针对乘性噪声情形下的开环和闭环远近程随机非零和博弈问题。乘性噪声情形

的远近程随机非零和博弈研究具有挑战性。由于乘性噪声具有非高斯属性，会使线性

系统具有一定的非线性特性，导致远近程随机非零和博弈问题难以求解。首先借助极

大值原理方法，通过解耦正倒向随机差分方程，导出了开环纳什均衡。其次，利用条

件数学期望的性质，设计了最优状态估计器。进一步利用正交分解方法，结合完全平

方技术，通过解耦Riccati方程，得到了最优的闭环纳什均衡策略。最后，通过仿真算

例验证了理论结果的有效性，并讨论了对更复杂系统的潜在扩展。

主要学术创新点包括：针对于加性噪声情形的非对称信息结构的开环和闭环远近

程随机非零和博弈问题，信息结构的不一致性导致传统的方法失效。本文所用的方法

是基于正交分解法和完全平方技术，利用一组耦合的Riccati方程的解，给出了最优闭

环纳什均衡策略。针对于乘性噪声情形下的远近程随机非零和博弈问题，克服了乘性

噪声系统带来的挑战，利用正交分解方法和完全平方方法，借助一组Riccati方程的

解，得到了纳什均衡的反馈显式解析形式。

关关关键键键词词词：：：非非非对对对称称称信信信息息息结结结构构构；；；非非非零零零和和和博博博弈弈弈；；；极极极大大大值值值原原原理理理；；；正正正交交交分分分解解解方方方法法法；；；开开开环环环和和和闭闭闭环环环

纳纳纳什什什均均均衡衡衡

Abstract

Inthetheoryofstochasticnonzero-sumgame,theexistingresearchmainlyfocusedon

stochasticnonzero-sumgamewithsymmetricinformationstructure.Consideringthatinthe

networkedsystem,thedecisionmakersarethelocalplayerandtheremoteplayerrespectively,

andpacketlosswilloccurintheinformationtransmission,resultinginasymmetricinformation

obtainedbythelocalplayerandtheremoteplayer.Thereislittleresearchonthelocaland

remotestochasticnonzero-sumgamewithasymmetricinformationstructure.Inthisthesis,

basedonthemaximumprinciplemethodandorthogonaldecompositiontechnology,theopen-

loopandclosed-looplocalan

您可能关注的文档

文档评论（0）

论文资源 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

含非对称信息结构的远近程随机非零和博弈研究.pdfVIP