给我们留言
91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于层次聚类和BILSTM的光伏短期功率预测模型

  2024-09-23    41  上传者:管理员

摘要:为解决现有光伏功率预测方法存在效率低和非线性预测精度不高的问题,提出一种混合光伏功率预测模型。首先通过支持向量机(SVM)提取模块降低输入数据维度;然后利用平衡迭代规约和聚类(BIRCH)模块挖掘数据中的信息,划分特征库;最后根据光伏功率的波动特性,建立其对应的双向长短期记忆网络(BILSTM)预测模型。将提出的混合模型应用于欧洲中期天气预报中心(ECMWF)提供的真实数据集上进行预测,通过与8种主流的机器学习算法相比,该模型在测试数据集上的平均绝对误差(MAE)和均方误差(MSE)分别降低了4.3%~59.75%和35.65%~78.29%。此外,混合模型还具有良好的可解释性,使其在电力行业有广泛的应用前景。

  • 关键词:
  • 光伏发电
  • 功率预测
  • 双向长短期记忆网络
  • 平衡迭代规约和聚类
  • 支持向量机
  • 加入收藏

随着能源科技的进步和光伏发电理论的发展,光伏发电正成为全球能源结构的重要组成部分。光伏发电本身具有清洁、灵活性和可持续性的优点,但同时其受多种天气因素影响,具有明显的波动性和间歇性特点[1]。为了进一步提高光伏发电的效率和稳定性,提高光伏功率预测的准确性是至关重要的[2]。准确的光伏发电功率预测对于提高电网稳定性、增加电网消纳光电能力以及提高新能源电站运营管理效率等方面都具有重要意义[3-4]。

在现有的研究中,主要用于构建光伏发电功率预测的模型有物理模型、基于统计和概率的模型、机器学习模型和混合模型。在物理模型方面,WANG J[5]通过对光伏系统的物理分析和建模,推导出了太阳能与关键天气特征之间的关系。在基于统计和概率的模型方面,赵滨滨[6]通过建立基于自回归积分移动平均模型(Autoregressive Integrated Moving Average,ARIMA)的分布式光伏系统输出功率预测模型,该方法消除了需要平稳时间序列输入的限制,进一步获得了更好的性能。除此之外,常见的统计模型还有季节性的差分自回归移动平均模型[7]、马尔科夫链模型[8]等。

文献[5-8]中的方法在光伏预测方面具有明显的优势,但由于光伏显著的非线性的特征,机器学习模型的优势更加突出[9-10]。例如,吴汉斌[11]采用支持向量机(Support Vector Machine,SVM)算法对光伏系统功率进行预测,并通过优化算法得到最优模型,进一步提高了预测的准确性。ESSAM Y[12]在美国国家可再生能源实验室数据集上验证了人工神经网络在预测光伏输出功率方面的优异性能。此外,还有各种广泛应用于光伏发电功率预测的机器学习模型,如极限学习机(Extreme Learning Machine,ELM)[13]、最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)[14]、长短期记忆网络(Long Short-Term Memory,LSTM)[15-16]、门控循环单元(Gated Recurrent Unit,GRU)[17]等。

然而,单个机器学习模型的预测精度是有限的。为了进一步提高光伏发电的预测精度,学者们把目光放在了混合模型上[18-21],如吴珺玥[22]利用Spearman相关系数法对多个天气变量进行分析,进一步筛选有效的物理变量,有效提高了时序卷积网络的预测精度。李争[23]采用小波变换提取天气变量的特征信号,提高了反向传播神经网络的预测精度。

本文采用SVM和平衡迭代规约和聚类(Balanced Iterative Reducing and Clustering using Hierarchies,BIRCH)算法作为数据处理模块,并采用双向长短期记忆网络(Bi-directional Long ShortTerm Memory,BILSTM)作为功率预测算法。该算法具有良好的非线性拟合度,并可以有效捕捉输入信息。为了进一步提高预测的效率和精确度,同时降低预测的空间复杂度,本文提出了一种新的混合预测模型——基于SVM,BIRCH和BILSTM的短期光伏功率预测。首先,利用SVM算法得到每个特征的权重,然后,通过BIRCH聚类将光伏数据划分到不同的特征库中,根据不同特征库建立对应的BILSTM预测模型。最后,将获得的测试集的预测数据和原数据进行比对。通过实验表明,所提出的混合模型显著提高了预测精度。


1、基于SVM的相关物理变量筛选


1.1 数据集介绍

研究采用欧洲中期天气预报中心(European Centre for Medium-range Weather Forecasts,ECMWF)提供的高质量光伏输出功率和数值天气预报(Numerical Weather Prediction,NWP)数据集。数据选自澳大利亚悉尼(东经151°12′,南纬33°51′)和中国武汉(东经114°21′,北纬30°46′),分别定义为数据集A和数据集B。该数据集覆盖2020年1月1日至2022年12月31日,采样间隔为1 h,共包含26304个数据点。其中,光伏组件的额定功率为1MW,其他选择的NWP数据变量的详细信息如表1所示。

表1 NWP数据变量信息

1.2 SVM特征提取

在光伏发电功率预测的背景下,SVM是一种高效的机器学习算法。其核心目标是寻找超平面,并通过最小化目标变量的光伏预测误差来确定该超平面。

基于SVM模型的特征选择是指为每个特征分配重要度分数进行回归预测,从而识别哪些特征对光伏发电功率预测的准确性有显著影响。其获取特征权重的原理是基于SVM的决策函数和特征映射。SVM通过训练数据集学习到1个决策函数,该函数将输入特征映射到输出类别。决策函数表示为:

式中:ω为权重向量;x为输入特征向量;b为偏置项。

针对高维特征,通过非线性映射φ(x)将输入空间的样本映射到高维空间,在高维空间建立线性函数,从而解决回归问题,即:

SVM根据特征对决策边界的影响为特征分配权重,表示每个特征对预测目标的影响。绝对值越大,它就越重要。通过分析权重ω,可以确定哪些特征在回归过程中起关键作用。SVM权值特征选择依次进行特征标准化、SVM模型训练、权值获取、模型评估等过程。在此过程中,可以得到最终的SVM模型,确定权重ω用于选择最相关的特征进行光伏发电功率预测。

与其他特征选择方法相比,基于SVM模型的特征选择考虑了特征与回归任务之间的关系,允许选择更多相关的特征,并降低了引入新维度的风险。同时,过滤掉具有潜在噪声或不相关特征的高维数据,有助于提高后续光伏预测的准确性。

1.3 SVM算法结果分析

为了进行后续的光伏预测研究,首先使用SVM进行物理变量选择,筛选用于后续BIRCH聚类和BILSTM预测的物理变量。以数据集A为例,筛选结果如表2所示,其中“\”代表特征丢弃。

表2 相关NWP变量的筛选

对于数据集来说,选择BIRCH聚类的特征准则是SVM权重的绝对值是否大于0.1,选择用于BILSTM预测的特征准则是SVM权重的绝对值是否大于0.06。符合标准的特征将被保留,其余的特征将被丢弃。


2、基于BIRCH聚类算法的光伏相关数据划分


光伏预测场景有很多不同的类型,这些场景的特点也有很大的不同。为了进一步挖掘光伏预测场景中NWP数据中的信息,引入了一种聚类算法,对不同数据特征的光伏数据库进行分类。

2.1 BIRCH聚类算法原理

聚类算法的基本概念是根据物以类聚的原理将数据划分为不同的组或类,使组之间的距离尽可能大,组内数据之间的距离尽可能小。经典的聚类算法包括K-means、K-means++、高斯混合聚类和BIRCH聚类等[24-25]。其中,BIRCH聚类具有高效性,在处理大规模数据时具有较低的时间和空间复杂度,同时可以处理不同形状、不同密度的数据集。因此,针对大规模的光伏数据集且数据形状不明显的NWP特征,选用BIRCH聚类进行数据特征库的划分。

BIRCH聚类算法是典型的层次聚类算法,通过利用一个类似于平衡B+树的聚类特征树(Clustering Feature Tree,CF Tree)来帮助快速聚类。聚类特征树中的每个节点由若干个CF组成,包括叶子节点和内部节点。其中,每1个节点都对应聚类得到的1个簇。这种聚类特征树的结构可以有效地进行单遍扫描数据集[26],而不需要对数据集进行多次扫描。通过将数据集中的样本分配到聚类特征树中的各个节点上,可以快速地找到数据的分布情况,并进行聚类分析。

通过BIRCH聚类将数据划分为k簇,并根据轮廓系数(Silhouette Score,SC)法评估聚类的结果。轮廓系数S通过计算样本i与同一簇内其他样本的平均距离p(i),即簇内不相似度,和样本i与最近的不同簇内其他样本的平均距离q(i),即簇间不相似度,来评估聚类的效果,其表达式为:

式中:n为样本数量。

轮廓系数的取值范围为[-1,1],且值越接近1,说明聚类效果越好。

2.2 BIRCH聚类算法结果

为了进一步表现BIRCH算法应用于光伏数据的优越性并确定其聚类的簇数k,以数据集A为例,将其与K-means、K-means++和高斯混合聚类进行轮廓系数比较,结果如图1所示。

图1 多种聚类算法结果评估比较

通过对比可以发现,BIRCH算法相较于其它算法具有显著的优越性,可以更好地划分具有不同特征的数据库,并确定聚类的簇数为3。进一步观察聚类结果,聚类结果如图2所示。

图2 聚类结果在光伏功率上的显示

通过观察BIRCH聚类算法的结果在光伏功率上显示,可以发现聚类划分出了具有显著不同特征的数据库。其中,类别1具有强烈的波动性,且集中于高功率;类别2集中在中部,波动性较小;类别3则集中在低功率区域。这3种特征库为下一步BILSTM预测提供了更有力的数据,从而提高光伏预测的速率和精度。


3、基于BILSTM的光伏预测模型


针对光伏数据的高维、非线性和极端值特点,本文采用BILSTM算法进行预测。BILSTM能捕捉数据的长期和短期依赖性,适应高维非线性数据,泛化能力强,实现简单且鲁棒性好,能降低极端值的影响,因此适用于光伏数据预测。

3.1 LSTM预测算法原理

LSTM算法在光伏预测长时间序列上具有优异的表现,解决了传统循环神经网络(Recurrent Neural Network,RNN)算法的梯度消失问题,能够更好地捕捉序列数据中的长期依赖关系,并且针对非线性预测具有较好的拟合性[27]。其算法原理主要基于输入门、遗忘门和输出门3个关键的设计,其示意图如图3所示。

图3 LSTM结构

图3中,Ct-1和Ct分别为t-1和t时刻的记忆单元。具体运作过程如式(4)-式(7)所示。

(1)遗忘门负责控制信息的传递,主要负责在外界输入中提取一些有效的信息。

式中:ft为遗忘门的输入;σ为激活函数;Wf为遗忘门输入权重;ht-1为上一时刻输出状态值;Xt为输入量;bf为遗忘门偏差。

(2)输入门负责决定新信息是否加入到记忆中。

式中:it为输入门的输入;Wo为输入门权重;bi为输入门偏差;gt为候选单元状态;Wi为记忆单元权重;bc为记忆单元偏差。

(3)输出门负责决定输出的信息。

式中:ot为输出门的状态;Wo为输出门权重;bo为输出门偏差。

3.2 BILSTM预测算法原理

尽管LSTM具有优异的性能,但光伏数据具有前后关联性强的特性。为了解决光伏数据高关联性的问题并进一步提高预测性能,研究采用BILSTM预测模型。BILSTM通过2个独立的LSTM层,分别从正向和反向2个方向处理输入序列。这种双向处理机制使得BILSTM能够捕捉到输入的更多信息[28],进一步提高了预测性能。其结构如图4所示。

图4 BILSTM结构

根据图4的结构,更新BILSTM为:

式中:Ot为输出预测值。和分别为前向和后向连接权重;和分别为前向和后向的输出状态值;bt为输出层偏差。

3.3 整体预测框架

本文提出了一种基于SVM-BIRCH-BILSTM的混合模型,具体流程图如图5所示。


4、仿真分析


4.1 误差评价指标

在光伏预测领域中,平均绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Squared Error,MSE)、均方根误差(Root Mean Squared Error,RMSE)、拟合优度(R-square,R2)的具体表达式如式(9)-式(12)所示。MAE,MSE和RMSE的值分别用EMA,EMS和ERMS表示,其中EMA,EMS和ERMS结果越小,表明预测结果的精确度越高;R2结果越接近1,预测拟合的模型越精确。

式中:yi为光伏预测输出功率的实际值;为光伏预测输出功率的预测值;为光伏预测输出功率实际值的均值差;m为测试集的样本数量。

4.2 功率预测实验结果

4.2.1 实验设置

具体的实验环境参数如下:基于Python3.9和Pytorch建立网络模型进行训练和测试。此外,BILSTM模型使用Adam优化器和均方误差作为损失函数。根据网格搜索法,BILSTM模型参数和本文提出模型中BILSTM模型参数具体设置如表3所示,其中学习率无量纲。

表3 BILSTM参数设置

4.2.2 消融实验

针对不同类别的数据集构建相应的BILSTM预测模型,所提出的混合模型在数据集上表现出优异的拟合能力,证实了其出色的预测性能。为了进一步探索研究提出的预测模型中各模块的作用,通过消融实验进行了比较。评价对比结果如表4所示。

图5 SVM-BIRCH-BILSTM的流程图

在数据集A中,研究提出的模型的EMA,EMS和ERMS分别为0.010 67,0.000 502 8和0.022 42。与BILSTM,SVM-BILSTM和BIRCH-BILSTM相比,分别下降了14.71%~39.27%,25.95%~43.55%和13.97%~24.87%。此外,表示数据拟合程度的R2也得到了改进。以EMA值为参考,SVM-BILSTM和BIRCH-BILSTM模型分别比初始BILSTM模型降低14.74%和28.80%。该结果验证了SVM提取模块和BIRCH聚类模块的有效性。显然,研究提出的模型有效地结合了上述2个模块,并取得了更好的预测性能。同时,在数据集B中,也获得了同样优异的模型评估结果,进一步证明本文中模块结合的有效性。

4.2.3 对比试验

在现有的研究中,用于光伏发电功率预测的预测模型有很多,如机器学习模型SVM和逻辑回归(Logistic Regression,LR)、树形模型决策树(Decision Tree,DT)以及深度学习模型LSTM、GRU等,均表现出较好的预测能力。为了进一步探索提出的混合模型的预测性能,将提出的预测模型SVM-BIRCH-BILSTM与SVR,LR,贝叶斯(Bayesian,Bayes),K最近邻算法(K-Nearest Neighbors,KNN)、DT、LSTM、GRU和RNN模型进行比较,评价结果如表5所示。不同数据集的对比结果如图6和图7所示,通过结果可以看出,研究提出的混合模型的性能非常优异。

图6 数据集A比较实验结果

图7 数据集B比较实验结果

在数据集A上,该模型的EMA,EMS,ERMS和R2值分别为0.010 67,0.000 502 8,0.022 42和0.989 9,预测曲线拟合良好。与其他8个机器学习模型相比,该模型在数据集A上的EMA,EMS和ERMS值分别降低了4.3%~59.75%,35.65%~78.29%和19.79%~53.42%,同时也表现出更好的模型适应度。

表4 消融实验评估结果

表5 比较实验评估结果

为了避免该方法对数据集的依赖性,进一步补充了实验案例。在数据集B上,模型得到的EMA,EM,ERMS和R2分别为0.005 530,0.000 114 0,0.010 68和0.997 4。与其他方法相比,该模型同样取得了显著的性能提升。同时,通过补充实例,进一步证明了该模型具有良好的泛化性能。

综上所述,SVM提取模块和BIRCH聚类模块可以进行有效的结合。同时BILSTM具有良好的非线性拟合能力,进而混合预测模型SVM-BIRCH-BILSTM在光伏预测上有优异的表现。


5、结论


针对光伏发电系统的波动性、间歇性和复杂性等特点,本文提出了一种基于SVM-BIRCH-BILSTM的混合光伏发电功率预测方法。通过多次实验,研究提出的混合预测模型SVM-BIRCH-BILSTM具有以下优点:

1)提高预测精度:将混合模型与LSTM,GRU等8种光伏预测常用模型进行比较,在MAE,MSE,RMSE和R24个评价指标上均取得了较好的效果。

2)增强可解释性:通过消融实验验证了SVM提取模块和BICRH聚类模块在提高预测精度方面的有效性。实验中轮廓系数法的加入为BIRCH参数的选择提供了强有力的理论支持。同时,通过SVM提取模块和聚类算法对数据进行预处理,可以提取出与预测任务相关的特征或信息。这些特征或信息可以作为输入传递给预测模型,提高模型的预测准确性。

3)提高泛化能力:BILSTM混合模型对光伏发电功率预测在2个不同的数据集上均具有较高的拟合程度,并通过聚类后的多个特征库实验验证了其泛化性能,为其在电力行业的应用提供了一定的实验和理论依据。

研究验证了SVM-BIRCH-BILSTM混合模型在预测光伏系统输出功率方面的可行性、合理性和有效性。该模型通过结合多种算法的优势,为光伏发电预测提供了一种全新的数据处理方法。在后续研究中,我们将针对已经兴起的大规模分布式光伏发电系统就光伏功率预测进行进一步深化研究。


参考文献:

[1]杨海柱,李庆华,张鹏.基于tGSSA-DELM的短期光伏发电功率预测[J].智慧电力,2023,51(10):70-77.

[2]郑珂,王丽婕,郝颖,等.基于数据集蒸馏的光伏发电功率超短期预测[J].中国电机工程学报,2024,44(13):5196-5208.

[3]董志强,郑凌蔚,苏然,等.一种基于IGWO-SNN的光伏出力短期预测方法[J].电力系统保护与控制,2023,51(1):131-138.

[4]黄杨珏,张晓珂,沈开程,等.基于智能混合预测策略的短期光伏功率预测[J].电网与清洁能源,2023,39(11):111-119.

[6]赵滨滨,王莹,王彬,等.基于ARIMA时间序列的分布式光伏系统输出功率预测方法研究[J].可再生能源,2019,37(6):820-823.

[7]赵泽妮,云斯宁,贾凌云,等.基于统计模型的短期风能预测方法研究进展[J].太阳能学报,2022,43(11):224-234.

[8]李一,杨茂,苏欣.基于集成聚类及改进马尔科夫链模型的光伏功率短期预测[J].南方电网技术,2023,17(10):113-122.

[9]李立刚,孙立群,戴永寿,等.基于时空图卷积神经网络的光伏发电功率超短期预测方法[J].热能动力工程,2023,38(9):152-157,173.

[10]吴家葆,曾国辉,张振华,等.基于K-means分层聚类的TCNGRU和LSTM动态组合光伏短期功率预测[J].可再生能源,2023,41(8):1015-1022.

[11]吴汉斌,时珉,郑焕坤,等.基于EEMD-ALOCO-SVM模型的光伏功率短期区间预测[J].太阳能学报,2023,44(11):64-71.

[13]王鹏翔,沈娟,王菁旸,等.基于PCA-LMD-WOA-ELM的短期光伏功率预测[J].智慧电力,2022,50(6):72-78.

[14]岳有军,刘金林,赵辉,等.考虑特征提取和优化LSSVM的短期光伏功率预测[J].陕西科技大学学报,2023,41(3):200-207.

[15]赵龙,杨波,卢志鹏,等.基于谱聚类和AM-LSTM的分布式光伏集群超短期预测方法[J].供用电,2023,40(7):10-17.

[16]雷柯松,吐松江·卡日,伊力哈木·亚尔买买提,等.基于WGANGP和CNN-LSTM-Attention的短期光伏功率预测[J].电力系统保护与控制,2023,51(9):108-118.

[17]史加荣,殷诏.基于GRU-BLS的超短期光伏发电功率预测[J].智慧电力,2023,51(9):38-45.

[18]李博彤,李明睿,刘梦晴.基于通径分析和相空间重构的光伏发电预测模型[J].电测与仪表,2022,59(11):79-87.

[19]宋玮琼,赵成,郭帅,等.考虑天气类型和历史相似日的短期光伏输出功率预测[J].电网与清洁能源,2023,39(2):75-82.

[20]陈文进,朱峰,张童彦,等.基于AFSA-BP神经网络的光伏功率预测方法[J].浙江电力,2022,41(4):7-13.


基金资助:国家自然科学基金资助项目(62103308); 南方电网公司科技项目(GDKJXM20210194)~~;


文章来源:张晓珂,张辉,戴小然,等.基于层次聚类和BILSTM的光伏短期功率预测模型[J].智慧电力,2024,52(09):41-48.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

我要评论

浙江电力

期刊名称:浙江电力

期刊人气:1242

期刊详情

主管单位:浙江省电力工业局

主办单位:浙江省电力学会,浙江省电力试验研究院

出版地方:浙江

专业分类:电力

国际刊号:1007-1881

国内刊号:33-1080/TM

创刊时间:1979年

发行周期:月刊

期刊开本:大16开

见刊时间:10-12个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定