
摘要:【目的】分布式电源发电的随机性和波动性,给有源配电网(active distribution network,ADN)的电压控制带来了严峻的挑战,在此背景下,亟需一种高效的电压控制策略来保证ADN的安全运行。【方法】基于深度强化学习方法,提出了一种双层区域配电网电压控制策略。首先,以调压设备的调节特性和可控元素复杂化的特点为前提,针对ADN辐射网架结构,设计了区域协调控制区域和本地自治控制区域,分别构建每个区域的电压控制模型;然后,通过深度Q网络(deep Q-network,DQN)算法和深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法对该模型进行求解,以实现实时跟踪电压变化的目的,有效解决了ADN运行过程中电压控制问题;最后,通过IEEE33节点仿真算例对该方法进行了验证。【结果】利用DQN算法和DDPG算法分别求解协调控制区域和本地自治区域的控制变量,实现了ADN系统电压调节的实时决策,解决了ADN潮流双向流动、电压复杂多变的问题。【结论】所提控制策略控制电压偏差效果明显,具有很强的准效性和实用性。
与传统的被动配电网不同,有源配电网(active distribution network,ADN)可以实现电网的双向流动和信息的互联互通[1],同时,ADN还能提高分布式电源的利用效率和经济性,促进可再生能源开发,符合国家能源转型的发展方向[2-7]。但是,该方法也对电网的电压控制提出了更高的要求[8],因为不恰当的电压水平会导致设备发生过电流,进而引起用户设备的损坏[9-10]。所以,应当将有效控制ADN的电压波动作为后续研究的重点之一[11-12]。
ADN电压波动控制问题较为复杂,是拥有众多目标函数、变量和约束条件的高维非线性问题[8]。目前,高维非线性问题的解决思路主要采用启发式搜索算法[13-15]和二阶锥松弛技术[16-17]。文献[18-19]采用启发式搜索算法中的粒子群算法和遗传算法对配电网进行协调控制,以改善配电网运行过程中的电压偏移现象,但是,该方法计算量大,时间成本较高,需要耗费大量的计算资源;文献[20-21]利用二阶锥技术求解可控设备模型来实现电压偏差最小化,但是,此类技术依赖于源荷预测数据和精确的电力系统优化模型,难以实现配电网电压实时调控的要求。
人工智能技术有望解决先前诸多方法的局限性,所以,诸多学者探讨了基于新一代人工智能技术[22]的配电网电压波动调控方法[23-24]。其中,强化学习(reinforcement learning,RL)方法作为人工智能技术的重要分支被广泛应用。文献[25-26]研究了单层尺度RL方法在配电网中的应用问题,该方法可以实时提供灵活的控制决策,针对电压波动问题控制效果良好。但是,文献[27]的研究发现,单层尺度RL容易受到环境变化的影响,出现过拟合现象。针对此问题,文献[28-29]基于长短时间尺度RL开展了研究,在配电网电压控制方面具有灵活性、自适应性。然而,上述方法均未考虑控制变量和AND拓扑结构的特点,所以存在模型不确定性,导致算法的控制效果不稳定。
因此,基于上述电压波动控制技术中所存在的问题,本文提出了基于深度强化学习的有源配电网电压分层控制策略。分层建立有功-无功协调优化模型后,采用深度强化学习算法求解;此外,考虑控制变量和AND拓扑结构的类型,提出利用深度Q网络(deep Q-network,DQN)算法求解区域协调控制的离散型设备变量,利用深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法求解本地自治区域的连续型设备变量,以达到算法和物理模型有机整合。最后,基于IEEE 33节点划分多层次电压控制区域,验证了本文所提出的算法的有效性。
1、电压分层协调控制总框架
1.1控制指标
将配电网的电压可以分为3个不同的状态区间:正常状态区间、预警状态区间和紧急状态区间,如图1所示。
图1 配电网电压分布状态图
1)正常状态
安全阈值设置为[0.95 pu,1.05 pu]。
2)紧急状态
紧急状态表达式为
式中:fVSmin,i和fVSmax,i分别为第i个区域上紧急状态下限值和上限值;fVXmin,i和fVXmax,i分别为第i个区域下紧急状态下限值和上限值。
3)预警状态
预警状态表达式为
式中:fYVSmin,i和fYVSmax,i分别为第i个区域上预警状态下限值和上限值;fYVXmax,i和fYVXmin,i分别为第i个区域下预警状态上限值和下限值。
1.2控制框架
本文核心是分区对不同类型的控制设备进行控制,图2为配电网分层控制方法的结构图。
主动配电网电压分层协调控制系统由主动配电网管理系统(active distribution management system,ADMS)、区域协调控制器和本地自治控制器3部分组成。控制器被安装在每个区域中,并且各个负荷节点处的电压传感器与控制器通信网络相邻布置。ADMS通过采集到的节点电压数据进行计算,当判断电压偏差平均标幺值处于紧急状态时,将信号传给区域协调控制器,采用DQN进行训练,得出调压器分接头的最佳档位位置;若区域协调控制器没有收到信号或者通过区域协调控制器控制以后,电压仍然处于非正常状态,则通过本地自治控制器对光伏逆变器、静态无功补偿装置(static var compensator,SVC)和储能进行调节,采用DDPG算法进行训练,获得最优控制策略后将控制信号下达到各个调压设备,实现电压实时自治控制,整体控制流程如图3所示。
图2 配电网分层控制方法结构图
图3 整体控制流程图
2、深度强化学习算法
2.1 DQN算法
DQN算法通过使用神经网络来估计当前状态下每个行动的Q值,输入是一个状态s,输出是一个向量,其中每个元素表示一个可能的动作a的Q值:
式中:θ为神经网络的权重参数;Q(s,a)为真实的Q值;Q(s,a;θ)为神经网络估计的Q值。
目标是最小化Q值的平方误差损失,即:
式中:r(t)为当前状态和行动的奖励;γ为折扣因子;s′为下一个状态;a′为下一个状态下所有可能行动的最大Q值对应的行动;θ_target为目标网络的权重参数。
DQN算法使用随机梯度下降来更新神经网络的权重参数θ。可以计算损失函数L(θ)的梯度:
式中:s'_i为第i组数据的下一个状态;a_i为第i组数据下一个状态下所有可能行动的最大Q值对应的行动;r_i为第i组数据下状态和行动的奖励。
根据梯度下降算法,更新神经网络的权重参数θ,即
式中α为学习率。
DQN算法使用ε-greedy策略来选择行动,该策略以ε的概率选择随机行动。其中,ε为探索率,通常在训练早期设置较高的值,然后逐渐降低到一个较小的值。
2.2深度确定性策略梯度算法
DDPG算法将经验数据(st,at,rt,st+1)存储到经验池中,通过同时建立Actor目标网络和Critic目标网络来输出目标Q值,并通过最小化目标Q值和Critic网络输出Q值的差值完成模型的优化训练。
使用高斯分布表示输出的概率分布,即
式中:a为输出的动作;μ为策略网络;ε(1)为高斯噪声;θμ为策略网络的权重参数。
使用策略梯度算法来训练策略网络,即最大化长期回报的期望值J(θμ):
式中:Eπ表示在策略π下的期望;Q(s,a|θQ)是值函数网络,即状态-动作值函数;θQ为Critic目标网络的权重参数公式;∇aQ(s,a|θQ)表示状态-动作值函数相对于动作a的梯度。
值函数网络是一个连续函数,使用均方误差(mean squared error,MSE)作为损失函数,即
式中y=r+γQ[s′,μ(s′|θμ)|θQ]表示目标值。
使用梯度下降算法来更新权重参数θQ,即
式中∇θL[θQ(t)]是损失函数相对于θQ(t)权重参数的梯度。
3、基于深度强化学习算法的分层调压控制模型
3.1电压控制数学模型
在调节区域协调控制节点电压时,将控制的目标设置为:最小全域配电网母线节点电压越限值平均值,表达式为
式中:为全域配电网母线节点电压平均值;为配电网平均电压额定值。
在调节本地自治区域部分节点电压时,将控制目标设置为最小自治区域母线节点电压越限值,表达式为
式中:Ui为第i个节点的节点电压;UN为该区域配电网额定电压值;M为该区域配电网母线节点数。
约束条件如下。
1)潮流平衡约束
潮流平衡约束为
式中:Pi,L(t)和Qi,L(t)分别为在t时刻节点i上负荷消耗的有功和无功功率;PLoss(t)和QLoss(t)分别为t时刻线路中的有功损耗和无功损耗;PM(t)和QM(t)分别为t时刻从主配网上传输的有功和无功功率;Pi,PV(t)和Qi,PV(t)分别为t时刻分布式光伏的输出有功和无功功率;Pi,ES(t)为t时刻节点i上储能输出有功功率;Qi,SVC(t)为t时刻节点i上SVC输出无功功率。
2)光伏逆变器约束
光伏逆变器约束为
式中:分别为光伏逆变器输出有功的上限和下限值;表示逆变器的容量。
3)储能出力约束
储能出力约束为
式中:为t时刻节点i上储能输出有功变化量;和分别为t时刻节点i上储能输出有功的最小值和最大值;和分别为t时刻节点i上储能输出有功最小和最大变化量。
4)SVC出力约束
SVC出力约束为
式中:为节点i上SVC输出无功变化量;和分别为节点i上SVC输出无功上下限;和分别为t时刻节点i上SVC输出无功爬坡上下限。
5)有载调压变压器约束
有载调压变压器分接头调节范围的计算公式如下:
式中:ntpmin为有载变压器分接头最小调节值;ntpmax为有载变压器分接头最大调节值;xpromin为有载变压器最小可调比例;xpromax为有载变压器最大可调比例;ntpnow为有载变压器分接头当前所处位置;n为区域数量;Ueq,i为等效电压。
3.2深度强化学习算法设计
将深度强化学习应用于配电网的电压控制中,将电压控制问题转化为马尔科夫决策过程,并通过对智能体在环境中进行探索和学习来获得最优的控制行为。该算法将配电网潮流系统状态映射到控制动作,同时利用奖励函数和控制变量映射来实现控制目标,在满足约束条件的前提下确保配电网系统的安全运行。
3.2.1区域协调控制的DQN算法
1)状态空间
将母线节点电压作为被控制对象,则状态空间为节点电压的集合SDQN:
式中:vi表示节点i电压的标幺值;N为全域配电网母线节点数。
2)动作空间
将有载变压器分接头的位置设置为DQN算法的动作空间ADQN,假设每个设备有n个档位,设置相同的调节范围:i×1%pu,-n≤i≤n;档位调节的总范围±n×1%pu,即
3)奖励函数
将点电压越限量作为控制目标,奖励函数设计为rDQN,i:
式中:β为权重系数;为全局配电网母线节点电压的平均标幺值超过正常状态的数值。
3.2.2本地自治控制的DDPG算法
1)DDPG算法的状态空间
将各节点电压、有功功率和无功功率波动作为状态变量,构建配电网电压控制的状态空间的:
式中:dvi为节点i电压的波动;pi为节点i的有功功率;dpi为节点i有功功率波动;qi为节点i的无功功率;dqi为节点i无功功率波动;1≤i≤M。
2)DDPG算法的动作空间
将并入的设备动作出力集合{ADDPG.i}可以定义为动作空间:
3)DDPG算法的奖励函数
将节点电压越限量和设备出力调节量作为奖励函数RDDPG,i来更新DDPG算法的策略网络和值函数网络,即
式中:Δvi为母线节点i的电压标幺值的越限值;表示母线节点i的无功变化量;B1表示电压偏差项的惩罚系数;C1和C2表示分布式光伏输出有功、无功调节量项的惩罚系数;D1表示储能输出有功调节量项的惩罚系数;E1表示SVC输出无功调节量项的惩罚系数。
4、仿真验证
4.1仿真分析
采用标准IEEE 33节点配电网系统进行仿真,拓扑图如图4所示。系统中调压器位于节点1,额定容量为100 MV⋅A,调节范围根据具体情况确定,该算例具体包括分布式光伏、储能电池、SVC,设备参数如表1所示。
通过配电网控制区域划分方法,将配电网按图4中的划分结果进行划分,结果如表2所示。
图4 IEEE 33节点配电网拓扑图
表1 设备参数
表2 控制区域划分结果
4.2结果分析
IEEE 33节点配电网在某一时刻引入功率扰动,部分节点越过正常状态区域限值,首先根据有载调压器的调节范围对DQN算法进行设计。
使用DQN智能体进行训练,每次训练290个样本,共进行500次训练。初始阶段,智能体奖励值较低,经过230次训练episode后,DQN智能体逐渐收敛于最优策略,其奖励值稳定且震荡幅度减小。最终,DQN智能体学习到了调节调压器分接头对电压控制的最优策略,具有良好的控制性能。DQN智能体训练结果如图5所示。
图5 DQN智能体训练过程
图6为区域协调控制前后节点电压图。由此可见,各母线电压幅值有所下降,但仍然有部分母线节点电压标幺值处于非正常状态安全阈值之间,因此,需要通过DDPG算法对电压越限节点所在区域做进一步的处理。DDPG智能体训练结果如图7所示。
DDPG智能体训练1 000个episodes,每个episode在训练300个样本后结束,经过70个episode后DDPG智能体的奖励值稳定,表明算法已收敛。图8为未削减光伏有功情况下节点10—17的控制效果。可见,控制区域内的节点电压并未控制到正常状态内,因此需要进一步削减有功功率。图9为通过光伏有功削减后节点10—17节点的电压,可快速有效地将母线节点电压控制在安全阈值内。
图6 区域协调控制前后节点电压图
图7 DDPG智能体训练结果
为了验证本文方法控制的优越性,将本文方法与传统的麻雀搜索(sparrow search algorithm,SSA)算法和粒子群优化(particle swarm optimization,POS)算法进行对比,不同策略下的控制结果如表3所示。SSA在控制调节上响应时间为5.52 s,平均电压偏差0.002 9 pu,POS在控制调节上响应时间为4.84 s,平均电压偏差0.003 1 pu.。而采用强化学习控制方法进行调节时响应时间为0.11 s,平均电压偏差0.002 3 pu.,可以看出,本文控制策略虽然与其他算法在平均电压偏差上相差不大,但是大幅度缩短了算法响应的时间,充分显示了该强化学习算法的高效性和准确性。
图8 无有功削减情况下的电压控制效果
图9 加入有功削减情况下电压控制效果
表3 不同策略下的控制结果
5、结论
针对有源配电网内不同时间响应的调压设备特性,提出一种基于深度强化学习的有源配电网电压分层控制策略,具体结论如下:
1)针对有源配电网电压特性,将有源配电网电压等级划分为3个不同的区域,有助于有源配电网系统的实时监测和管理,便于后续开展有源配电网电压控制。
2)针对不同控制对象的响应特点,利用DQN算法和DDPG算法分别求解协调控制区域和本地自治区域的控制变量,实现了ADN系统电压调节的实时决策。
3)经IEEE 33节点实验结果表明,所提方法可以有效保证电压稳定在正常状态之内;与SSA算法和POS算法相比,所提方法在响应时间和响应效果方面均有更大的优势。
参考文献:
[1]江道灼,徐宁,江崇熙,等.蜂巢状有源配电网构想、关键技术与展望[J].电力系统自动化,2019,43(17):1-11.
[2]刘建伟,李学斌,刘晓鸥.有源配电网中分布式电源接入与储能配置[J].发电技术,2022,43(3):476-484.
[3]于淼,闫旻睿,万克厅,等.数据驱动的有源配电网运行态势智能感知方法[J].电力建设,2024,45(7):34-53.
[4]蔡欢,袁旭峰,熊炜,等.柔性互联配电网运行调度研究综述[J].智慧电力,2022,50(6):92-99.
[5]闫群民,董新洲,穆佳豪,等.基于改进多目标粒子群算法的有源配电网储能优化配置[J].电力系统保护与控制,2022,50(10):11-19.
[6]仲泽天,李梦月,王加澍,等.一种有源配电网分布式光伏消纳能力评估方法[J].电网与清洁能源,2023,39(2):60-68.
[8]彭生江,陆军,张中丹,等.光伏接入对电网的影响研究[J].电力系统保护与控制,2021,49(5):157-164.
[9]段穰达.有源配网后评价指标体系及其综合评价方法[J].发电技术,2021,42(1):86-93.
[10]张华赢,艾精文,汪伟.基于约束型深度强化学习的主动配电网电压控制策略[J/OL].
[12]符杨,廖剑波,李振坤,等.考虑越限风险的主动配电网日前优化调度及运行[J].中国电机工程学报,2017,37(21):6328-6338.
[13]李鹏,姜磊,王加浩,等.基于深度强化学习的新能源配电网双时间尺度无功电压优化[J/OL].中国电机工程报:1-15.
[14]蒋平,梁乐.基于内点法和遗传算法相结合的交直流系统无功优化[J].高电压技术,2015,41(3):724-729.
[15]李晓利,高金峰.用于配电网多目标无功优化的改进粒子群优化算法[J].电力自动化设备,2019,39(1):106-111.
[16]林少华,吴杰康,莫超,等.基于二阶锥规划的含分布式电源配电网动态无功分区与优化方法[J].电网技术,2018,42(1):238-246.
[17]肖遥,别朝红,黄格超,等.基于二阶锥最优潮流的机会约束分布鲁棒优化研究[J].电网技术,2021,45(4):1505-1517.
基金资助:国家自然科学基金项目(52207009); 南方电网公司科技项目(GDKJXM20200331)~~;
文章来源:杜婉琳,王玲,罗威,等.基于深度强化学习的有源配电网电压分层控制策略[J].发电技术,2024,45(04):734-743.
分享:
基于全球经济一体化的时代背景,科技的发展不仅让市场竞争的激烈程度加剧,也让中国经济步入新常态。而国有控股企业因受企业性质的影响和约束,在发展过程中需要不断结合自身特点及需求来创新采购管理模式。正因如此,在随后的数年里,国有控股企业的采购工作先后经历了多个阶段,如分散采购、集中招标采购、产生物资集中采购以及集中采购等。
2025-03-28在全球能源体系加速重构与能源互联网深度演进的背景下,电力企业正经历着“三重变革”的叠加冲击:能源生产范式从集中式向分布式转变,资产运营模式从重资产向数字资产延伸,价值创造逻辑从规模效应向生态协同突破。这种变革使企业财务管理系统面临着电价波动传导、碳会计计量盲区与绿电资产估值困境等多维风险敞口。
2025-03-28电流互感器在正式投运以前,应做好相关现场试验。试验项目分为:直流电阻测试、极性试验、变比试验、绝缘电阻测试以及伏安特性试验。电流互感器依据的是电磁感应原理,它由闭合的铁芯和绕组组成。电流互感器的一次绕组匝数很少,串接在要测量电流的线路中,二次绕组匝数比较多,串接在测量仪表和保护回路中[1]。
2025-03-28在电机驱动系统的设计和优化过程中,系统整体效率的提升是一个至关重要的目标。这一效率的高低主要受到两个关键部分的损耗影响:首先是逆变器损耗,其次是电机损耗。在逆变器损耗方面,导通损耗是一个重要的组成部分,它主要取决于功率器件在导通状态下的电阻值。
2025-03-28目前,针对上述放电问题的原因分析研究报道较多,主要涉及对半导电缓冲阻水带的质量、铝护套与缓冲层的间隙、皱纹铝护套电缆自身结构特性等原因的分析研究。虽然现在对缓冲层放电问题的解决方案尚无统一意见,但解决半导电缓冲阻水带质量问题始终处于首要位置。
2025-03-28干式变压器由于其易维护、故障率低等优点[1],近几年被广泛应用在储能、风电等领域。变压器作为电力系统中的核心设备之一,成本高昂,对系统稳定性有直接影响。变压器故障调查显示,运行中,变压器易发生绕组故障,绕组引起的故障占比超15%,其中短路是最为严重的故障之一。
2025-03-28铜芯聚氯乙烯(PVC)绝缘软电线(即BVR型电线)作为一种配电柜专用软电线,被广泛应用于各类建筑和公共场所中。但在安装使用过程中,时常有用户反映BVR型电线出现铜导体发黑现象。该现象的出现不仅造成了用户使用的困扰,也影响了企业的声誉,对此各线缆企业均极为重视。
2025-03-27随着我国基建事业不断发展,对电力设施使用的安全可靠性愈加关注,要求与电力设施配套的电缆不仅应具有优异的电气性能,同时还应具有较高的阻燃性。目前,特别是商场、地铁、剧院和医院等人员密集场所的电力设施用电缆,B1级阻燃性能已成为常规要求。
2025-03-27相关试验方法标准对护套拉伸性能测试时用于制作哑铃试件的试条厚度Hts范围规定较宽,即要求0.8Mm≤Hts≤2.0Mm,如果Hts<0.8mm,则允许Hts,Min=0.6mm;对于Pe护套,如果护套较厚且两面均较光滑,则哑铃试件厚度不需要削到2.0mm。较高的Hts虽便于相关测试人员采用磨平或削平方式制取护套试条并制作哑铃试件,但也可能对热塑性护套老化前后机械性能测试结果产生影响。
2025-03-27本工程位于海南省三亚市,是一个围栏安防监控工程,类似于机场四周围栏防入侵告警防护系统,由监控摄像机、雷达等组成多道防入侵报警系统,负责围栏及围栏外一定合理距离内的入侵报警工作,实现全天时、全天候、宽广域、多批次目标的高精度探测、跟踪和轨迹测量,准确报告人员入侵行为、时间和地点。
2025-03-27我要评论
期刊名称:发电技术
期刊人气:2241
主管单位:中国华电集团有限公司
主办单位:华电电力科学研究院
出版地方:浙江
专业分类:电力
国际刊号:2096-4528
国内刊号:33-1405/TK
邮发代号:80-912
创刊时间:1979年
发行周期:双月刊
期刊开本:大16开
见刊时间:7-9个月
影响因子:0.814
影响因子:0.657
影响因子:0.000
影响因子:0.688
影响因子:0.060
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!