基于深度强化学习的任务分析方法.pdfVIP

下载本文档

0
0
约3.88万字
约 12页
2025-03-27 发布于江西
举报
版权申诉

基于深度强化学习的任务分析方法.pdf

1、本文档共12页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第36卷第7期系统仿真学报Vol.36No.7

2024年7月JournalofSystemSimulationJul.2024

基于深度强化学习的任务分析方法

龚雪，彭鹏菲，荣里*，郑雅莲²，姜俊1

（1.海军工程大学，湖北武汉430033；2.武汉大学水资源与水电工程科学国家重点实验室，湖北武汉430072)

摘要：针对任务分析中任务协同交互耦合度高、影响因素繁多等问题，提出了基于序列解耦与深

度强化学习的任务分析方法，实现了复杂约束条件下的任务分解及任务序列重构。设计了基于任

务信息交互的深度强化学习环境，基于目标网络与评估网络损失函数间的差值改进SumTree算法，

实现任务间的优先级评估；将激活函数运行机制引入深度强化学习网络，提取任务特征，提出贪

婪激活因子，优化深度神经网络参数，确定智能体最优状态，从而进行智能体状态转换。通过经

验回放生成多目标任务执行序列图。仿真实验结果表明，该方法能生成最佳调度下的可执行任务

图；且相对于静态情景，该方法对动态情景有较好的自适应性，在领域任务筹划中具有良好的推

广应用前景。

关键词：任务分析；强化学习；评估网络；贪婪因子；耦合任务；激活函数

中图分类号：E917；TP391文献标志码：A文章编号：1004-731X(2024)07-1670-12

DOI:10.16182/j.issn1004731x.joss.23-0443

引用格式：龚雪，彭鹏菲，荣里，等.基于深度强化学习的任务分析方法[].系统仿真学报,2024,36(7):1670-1681.

Referenceformat:GongXue,PengPengfei,RongLi,etal.TaskAnalysisMethodsBasedonDeepReinforcement

Learning[J].JournalofSystemSimulation,2024,36(7):1670-1681.

TaskAnalysisMethodsBasedonDeepReinforcementLearning

GongXue,PengPengfeil,RongLil*,ZhengYalian?,JiangJun

(1.NavalUniversityOfEngineering,Wuhan430033,China;

2.StateKeyLaboratoryofWaterResourcesandHydropowerEngineeringScience,WuhanUniversity,Wuhan430072,China)

Abstract:Inresponsetothehighcouplingoftaskinteractionandmanyinfluencingfactorsintask

analysis,ataskanalysismethodbasedonsequencedecouplinganddeepreinforcementlearning(DRL)is

proposed,whichcanachievetaskdecompositionandtasksequencereconstructionundercomplex

constraints.Themethoddesignsanenvironmentfordeepreinforcementlearningbasedontask

informationinteraction,whileimprovingtheSumTreealgorithmbasedonthediffer

您可能关注的文档

文档评论（0）

经管专家 + 关注: 实名认证

服务提供商

专注于经营管理类文案的拟写、润色等，本人已有10余年相关工作经验，具有扎实的文案功底，尤善于各种框架类PPT文案，并收集有数百万份各层级、各领域规范类文件。欢迎大家咨询！

咨询作者（18人已咨询）已休息

用户编号：6055234005000000

1亿VIP精品文档

更多 >

基于深度强化学习的任务分析方法.pdfVIP