- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
元强化学习驱动的高比例分布式光伏智能配电网自适应调压技术
汇报人:葛磊蛟副教授所属院校:天津大学
电话微信:2024年08月
目录
一、元强化学习
二、传统智能配电网调压技术
三、基于强化学习的电压自适应控制
四、元强化学习驱动的自适应电压控制
1.元强化学习
1.1
1.1元强化学习定义
元学习,也称为“学习如何学习”,是一种机器学习方法,旨在通过
学习多个任务的经验,提高在新任务上的学习效率。元学习的核心思想是从一组任务中提取通用的经验和知识,从而在遇到新任务时能够快速适应和学习。
Multi-tasklearning
learntasksperformtasks
Meta-learning
learntolearntasks
quicklylearn
.Agent.
.Agent.
ho
a1
idi
8152
Episode1Episode2Episode1
……MDP1……MDP2…
Trial1Trial2
hihz
hohi
huhs
5051
rdo
ni,di
Agent.
a
nd
do
hs
hs
a2
a1
a1
S1
50
53
50
2
图1强化学习环境中循环元学习器的工作流程
元强化学习的目标是学习一个元策略(Meta-
Policy),该策略能够在不同任务上快速适应和优化。
1.元强化学习
1.2
1.2元强化学习原理
元强化学习(Meta-ReinforcementLearning,Meta-RL)是结合元学习(Meta-Learning)和强化学习(ReinforcementLearning,
RL)的一种新兴方法。它旨在通过学习如何学习,提高智能体在新任务
上的适应能力和学习效率。
φstep1:Sampleθ?=φθ1θ?1s;θ
φ
step1:Sampleθ?=φ
θ1
θ?1s;θ?)
θ?i)
l?(θ2)
aL?(x?s,y
a0
step2:
θi=θ-α?
θi
step3:AcrsQsstingL(θi)=L?(Xi,yi?;θ
step3:
l?(θi)
step4:AggregateLoss(φ)=∑(0)
step4:
J(φ)
step5:Updateφ
甲=p-B.l
step
step1:采样阶段
step2:训练阶段
step3:测试阶段
step4:聚合阶段
step5:更新阶段
目录
一、元强化学习
二、传统智能配电网调压技术
三、基于强化学习的自适应电压控制
四、元强化学习驱动的自适应电压控制
2.传统智能配电网调压技术
2.1
2.1国家重大需求:高质量发展智能配电网
技术路径
技术路径
成本高、精度差、调控难集中控制风/光/氢等多类型
成本高、精度差、调控难
集中控制
风/光/氢等多类型能源分散无序接入
实际困境
系
多拓扑的配电网
多拓扑的配电网运行方式
核心网网曹
理
供地大厦
基
基贴
番
罩
变电站宣以
变电站
宣
A空
换网
R民照户
基站分散控制rmx
基站
分散控制
本
变电站平t1ek
变电站
平
E电室
(())
州户
州户
应急御萍
防T
酬分布式控制E
文档评论(0)