91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于VMD混合多尺度机器学习模型的碳排放权价格预测

  2024-10-27    26  上传者:管理员

摘要:构造了一种融合变分模态分解的多尺度混合碳价预测模型VMD-PSO-LSTM。结果显示,该模型能有效映射并拟合复杂多尺度的碳价时频信号,预测误差RMSE、MAE、MAPE仅为0.210 9、0.176和0.002 1,碳价预测精度和稳定性均优于基准模型。该模型的预测效果并不受随机样本预测期限差异的影响,并在较长随机区间的样本外预测上误差较小,展现出较强的预测鲁棒性和稳定性。

  • 关键词:
  • VMD-PSO-LSTM模型
  • 多尺度
  • 机器学习建模
  • 碳排放权交易
  • 碳排放权价格
  • 加入收藏

依靠市场化手段,推进碳排放权交易是解决环境问题最具建设性的共识。价格是碳排放权市场的核心,厘清碳排放权市场交易中的价格形成机制,揭示碳溢价波动的动态机理,有助于提高碳交易价格政策的精准性,助推微观投资者和减排实体研判价格趋势、制定量化策略等,更好地发挥对减排行为的推动作用。

碳价预测研究可分为两类:一是基于GARCH波动率技术的价格预测研究。早期碳排放权市场价格机制不健全,碳价信号隐含较多的复杂波动因子,因此GARCH类模型成为碳价信号刻画的主要工具[1]。如,Byun等[2]指出GARCH簇模型能更好地拟合碳期货资产的价格波动,而非对称门槛GARCH模型、多元GARCH模型能够有效揭示碳资产与股票市场、能源市场等关联市场间的波动溢出和价格传导机制[3]。在碳价特征揭示方面,GARCH簇分形布朗运动模型、跳跃GARCH模型被证明能有效地解释碳价信号的多分形特征、时变跳跃以及杠杆效应[4-5],而基于更高阶矩属性的GARCH模型则被用于捕捉碳价遭受到的时变偏度和时变峰度信息的冲击关系[6]。二是基于EMD模态分解技术的混合碳价预测模型。EMD类模态分解技术能对非线性非平稳的碳价信号进行多尺度分解和数据降噪,将驱动碳价波动的成分信息分解为周期差异、频谱异质的各项本征模态,能有效捕捉碳价变化的时频特征[7-8]。基于EMD模态分解和最小二乘支持向量机LSSVM构建混合模型,崔焕影等[9]指出短期内EMD-GA-BP模型的碳价预测效果较优,而长期内组合模型EMD-PSO-LSSVM的效果更好。刘金培等[10]提出一种基于EMD模态分解的非结构数据流行学习碳价多尺度预测方法,分别使用ARIMA、偏最小二乘PLS以及神经网络等模型对碳价的高频、低频和趋势线进行预测。使用深度神经网络DNN和支持向量机模型SVM对EMD碳价各模态信息进行多步预测,闫梦等[11]构建基于BP算法的EMD-BP-DNN-LSV组合模型,并在广州碳交易市场取得较好的预测效果。使用局部线性嵌入LLE和鲸鱼优化算法WOA对碳价非结构信息进行参数优化,并使用最小二乘支持向量机LSSVAR进行外推预测,结果显示LLE-WOA-LSSVR组合模型的预测效果可行且有效[12]。

基于相同的建模思路,Huang等[13]构造基于变分模式分解VMD的集成碳价预测模型,结果显示集成模型VMD-GARCH和VMD-LSTM能够对欧盟碳价进行有效预测,特别是在价格上涨阶段的预测稳定性最强,而EMD-VMD-LSTM模型以及VMD-GRU模型则在中国碳市场上呈现良好的预测效果[14-15]。突破传统EMD的点预测缺陷,Ji等[16]构建了基于改进经验模态分解(ICEEMD)的三阶段垂直碳价区间预测模型,并使用核密度估计(KDE)算法进行区间估计,提高了预测可信度。

总体而言,上述文献为本研究提供了基础,但仍存在改进之处:一是GARCH簇模型对碳价尾部分布的假设要求较为严格,使得GARCH模型的碳价预测效果存在质疑;二是传统的EMD技术及其改进形式依然存在模态混叠、分解误差较大、残留噪声较多等缺陷,从而影响组合模型的预测效果。因此,本研究创新工作在于使用自适应的变分模态分解(variational mode decomposition, VMD)技术对原始碳价进行多尺度分解,并使用时间序列处理优势的长短期记忆神经网络(long short-term memory, LSTM)模型实现对各模态分量的多步预测,并引入粒子群优化算法PSO对LSTM预测模型进行寻优,即构建VMD-PSO-LSTM混和多尺度机器学习模型进行碳排放权价格的时频捕捉和非线性映射。


1、模型构建


1.1 VMD变分模态分解模型

作为一种自适应非递归形式的模态分解技术,VMD的典型优势在于灵活确定原始输入信号的模态数量,采用完全非递归的求解和变分过程,有效避免传统递归算法执行而导致的端点效应和模态分解混叠等问题,从而实现输入信号的模态分离和频域划分[17-18],尤其是对复杂度高、非线性强以及非平稳的时间序列处理展现较大优势。假设碳排放权价格信号是由特定中心频率和有限宽度的信号构成,VMD使用维纳滤波方法,在变分搜索和求解过程中自适应地寻优匹配每个模态的最佳中心和宽度。VMD分解过程如下。

① 碳排放权价格分解与变分问题构造。假设原始碳价信号S被分解为K个模态分量(IMF),为确保分解的碳价信号是特定中心频率和有限宽度的模态分量,设定寻优目标函数为各模态宽度之和最小,则信号变分表达式为:

式中:uk表示第k个IMF,则{uk}={u1,u2,…,uK}为VMD分解得到的碳价多尺度模态信号;{ωk}={ω1,ω2,…,ωK}是各模态信号的中心频率,δ(t)为单位脉冲信号。

② 为解决上述目标函数的优化求解问题,引入二次惩罚系数α和拉格朗日算子λ,将其转变为如下非约束的变分问题:

③ 非约束变分求解。采用乘法算子交替方向法ADMM连续更新各模态分量及其中心频率,即可得到非约束变分问题的最优解。所有分量均可根据频域空间由式(3)求解:

式中:ω代表波动频率;

经过维纳滤波之后的剩余量。进一步地根据得到的各分量,通过以下变换即可更新得到当前模态的中心频率ω:

1.2 PSO优化算法

粒子群优化算法(particle swarm optimization, PSO)是一种常用的全局搜索最优解的改进算法,其优点在于结构简单且参数依赖低,在函数优化、神经网络训练、线性约束问题求解等领域应用广泛[19]。根据任何一个粒子仅具备移动速度和位置2个属性,每个粒子都在搜索空间中单独进行寻优移动,搜索局部最优值,并在此过程中将个体极值信息与其他粒子进行共享,从而确定更大搜索范围内的全局最优值。而其他粒子也据此调整各自的寻优速度和移动位置,直至求出整个样本空间的最优解。PSO算法优化过程如下:

式中:vi,t表示粒子当前的移动速度;vi,t+1表示下一时刻粒子的移动速度;rand()表示0~1之间的随机数;p和g分别表示粒子局部最优解和全局最优解;η表示惯性系数;c1和c2表示学习因子,代表粒子朝向个体最优和全局最优的移动步长;γ为速度系数,通常取值为1。

1.3 基于LSTM的碳排放权价格模态分量预测模型

根据研究设计,VMD技术用于对非线性、非平稳的原始碳价信号进行多尺度分解,得到若干模态分量和残差项,而LSTM模型则用于对各分量进行非线性拟合与映射,从而汇总求解出碳价预测信息。之所以选择LSTM模型,一是因为作为链式结构神经网络,LSTM通过特殊设计的门结构能对输入信息进行有效的过滤、筛选和更新,保留序列的记忆性特征;二是模型具备较强的自学习自组织和自适应的优势,通过正反方向的监督和无监督学习进行参数寻优,可避免训练中因梯度过分衰减而造成的梯度消失、收敛困难等问题。LSTM各门结构的数据训练如下:

遗忘门(forget gate)作用在于对碳价各模态分量信息进行筛选和过滤,得到过滤输出

式中:ft表示通过遗忘门被筛选的数据输出;ht-1为上一层LSTM结构的网络输出;Wf表示权重,bf表示偏置,σ为sigmoid激活函数,xt表示价格模态信号的输入信息。

输入门(input gate)用于对遗忘过滤输出进行更新,通过sigmoid激活函数得到各模态分量的更新特征和维度信息:

式中:h为当前隐藏层;Wc和bc为输出门的权重和偏置;bo为输出门的偏置;it和

t为输入门的更新特征和候选细胞核变量;Ct为更新后的变量;ot为细胞核Cell的输出筛选信息。

输出门(output gate)决定隐藏层细胞核Cell中需要被记忆的模态分量特征,并通过激活函数映射得到本层输出:

式中:Wi为输出门的权重;bi为输出门的偏置;ht为整个LSTM结构的网络输出。

1.4 模型预测评价

使用误差类指标RMSE(ERMS)、MAE(EMA)、MAPE(EMAP)和市场预期指标DA作为评价模型及其基准模型碳价预测表现的参考。其中,误差指标越小,预测效果越好,否则越差;而市场预期指标DA越大,表明模型所展示的市场预期更符合投资者的市场判断,预测效果越好。

式中:yi表示碳排放权真实价格序列的样本值;

i表示各模型的预测价格序列的样本值;T表示样本总量。


2、实证建模与讨论


2.1 数据统计分析

作为全球最大规模的碳排放权交易市场,欧盟碳排放交易体系EUETS的碳金融产品种类丰富、交易活跃、价格机制相对成熟,特别是其中的欧盟碳配额(European Union allowance, EUA)无论是成交量、流动性还是履约机制和市场化建设等均优于其他产品。因此,选取欧洲能源交易所挂牌交易的EUA连续期货合约的结算价作为碳排放权的市场价格,数据区间选择2020年1月2日至2023年4月11日,时间范围涵盖欧盟碳交易体系第三阶段尾期和第四阶段初期。剔除非交易数据,共得到840个样本。在使用机器学习模型进行碳价各模态分量拟合与预测时,使用75%的数据用于参数训练,其余25%的数据用于多步预测。

基本统计结果如表1所示。首先,样本期内碳排放权价格均值为56.193,方差为25.553,峰度值为3.484,较大的方差和峰度表明价格数据离散明显,碳价呈现尖峰厚尾特征。JB统计量和LB统计量的显著性也表明碳价序列不服从正态分布,具备滞后记忆性特征。其次,单位根(ADF)检验的临界值为1.842,且不具备统计上的显著性,表明碳价原始数据存在单位根现象,数据信号非平稳。最后,BDS非线性相关性检验的结果均具备1%水平下的显著性,拒绝原价格序列平稳性的假设,说明碳价信号是非线性的。综上,碳排放权价格在样本期内存在非正态、非线性、非平稳特征,价格信号隐含较多数据噪声,因此适合模态分解技术进行多尺度分解。

表1基本统计结果

2.2 碳排放权价格模态信号分解

使用VMD模型对碳价信号进行多尺度分解,并根据数据长度和实证经验,将模态分解数量设定为9,即分解目标是得到8个游程分量和1个残差项,各时频信号的波动特征和模态信息三维分解见图1。图1立体呈现了各模态信号在固定采样空间内的时频特征和波动幅度,进一步可得到各模态分量的平均周期和相关系数,见表2。

图1碳排放权价格VMD分解的三维框架

表2 IMF模态

在各模态分量平均交易周期上,IMF2-IMF8信号周期在26.250 d以内,周期相对较短且信号震荡频繁,表示短期市场波动对碳价信号的冲击关系。残差项Resid信号周期最长,为140 d,周期较长信号振荡频率较低,表征了碳价长期波动趋势,即碳排放权市场交易的长期均衡价格。IMF1的信号周期为46.667 d,代表样本期内碳价信号的中期特征,表示投资者在面临碳排放权市场政策调整、极端事件冲击、能源环境政策变动等产生的市场反映。在模态相关系数上,反映长期趋势的模态分量残差项Resid的相关性最高,为0.612 7;反映中期趋势的IMF1信号相关性次之,为0.338 7;而信号震荡频繁、周期相关较短的短期信号的相关性相对较弱。上述各模态分量的信号周期和相关性差异也间接证明使用模态分解技术进行碳价波动分解的必要性和合理性。

2.3 基于变分模态分解混合模型VMD-PSO-LSTM的碳价预测

2.3.1 PSO参数设定

使用PSO算法是为了更好地优化混合碳价预测模型的网络结构,特别是模型训练学习率和迭代次数的设定。根据经验,PSO算法数据训练迭代次数通常设定为100左右,但具体数值还需结合迭代成本综合确定,通过使用逐步试验的方法,验证结果显示当迭代次数为50,PSO的训练损失ERMS为测试空间中最小值,为0.018,迭代效率最高(见表3)。即PSO参数寻优迭代50次后,适用度曲线和损失函数趋于平稳,因此,将此时对应的学习率0.150 00设定为最优的学习率。进一步地,根据经验法则,初始化群体个数设定为20,学习因子c1和c2均设定为2,权重系数最大值和最小值分别为1.2和0.8。在神经网络设定上,考虑到两层神经元已满足多数时间序列拟合问题的解决,因此,研究仅考虑两层网络的情况。

表3基于PSO优化的初始学习率参数寻优

2.3.2 基于VMD-PSO-LSTM模型的碳价样本外预测结果分析

使用混合VMD-PSO-LSTM模型进行碳价样本外预测,其过程实质上是执行“分解、预测、集成”的建模思路。即根据PSO参数优化设定,首先使用VMD分解技术将原始碳价信号进行模态分解和去噪处理,得到各模态分量和时频信号;其次使用优化的PSO-LSTM模型实现各模态信息的多步预测和拟合。最后,通过线性加总得到集成的碳排放权价格预测序列。为评估预测效果,选择GRU神经网络与其他CEEMD、EMD等模态分解技术构造成新的基准模型,在实验过程中执行与主模型相同的参数设计。值得注意的是,使用正常时间序列顺序的预测样本进行测试,从而保留序列本身的滞后性和自相关性特征。

样本外预测结果(见表4)显示,首先,基于变分模态分解VMD的混合碳价预测模型的预测误差和收益预期都是最优的。尤其是VMD-PSO-LSTM模型的样本外预测优势最为显著,预测误差ERMS、EMA和EMAP的指标值在所有模型中最小,分别为0.210 9、0.176 0和0.002 1,收益预期DA在结果中最大,数值为0.781 2。这表明相比其他模态分解技术,VMD模型能更有效揭示碳价原始信号的多尺度时频特征,而优化的PSO-LSTM模型也能够有效提升非线性模态信号的预测精度和性能。其次,在各类模态分解技术构造的混合模型中,经过PSO算法优化的模型预测效果也具有相对优势。即CEEMD-PSO-LSTM和EMD-PSO-LSTM模型的碳价样本外预测误差较小,而收益预期指标较大。如,CEEMD-PSO-LSTM模型的预测误差在CEEMD混合模型中指标值较小,预测误差ERMS、EMA和EMAP分别为1.178 8、0.951 5和0.011 6,而收益预期指标DA指标值较大,为0.770 3。

表4 VMD-PSO-LSTM模型及其基准模型的碳价样本外预测误差

图2和图3为VMD-PSO-LSTM模型及其基准模型的样本外动态MAPE和RMSE预测误差。根据图2和图3的动态误差曲线可观察到,基于VMD的混合碳价预测模型的预测值与真实值偏差最小,动态误差波动也相对稳定,动态误差散点相对集中,而其他模型表现得更加发散。这些证据进一步证明相比其他分解技术,VMD模型对碳价多尺度时频信号的刻画相对准确,能有效克服市场噪声对碳价原始价格的冲击,保障了价格信号的完备性和有效性。因此,VMD-PSO-LSTM模型能揭示复杂时间尺度特征碳价的溢价形成过程,模型的预测优势对于开展市场量化分析、研判市场行情具有一定的指导价值。

图2 VMD-PSO-LSTM模型及其基准模型的样本外动态MAPE预测误差

图3 VMD-PSO-LSTM模型及其基准模型的样本外动态RMSE预测误差

2.4 基于随机样本期限差异的碳价样本外预测的再检验

有别于前文按照时间序列顺序的测试集预测选择,研究进一步按照随机抽样排序的原则,随机抽取样本进行模型的训练和优化,从而剔除因时间序列本身滞后性而带来的预测效果影响,增强VMD-PSO-LSTM模型碳价预测的稳定性和鲁棒性。在验证中,根据预测期限差异,重新调整碳价序列的时间尺度,分别进行100个和50个随机交易样本的区间预测,其余数据用作模型训练,模型网络结构采用前文的设计,结果见表5。

首先,无论是在100个还是50个随机交易样本的预测效果上,VMD-PSO-LSTM模型的预测误差均小于其他基准模型,预测稳定性较好。即100个随机交易样本的预测误差ERMS、EMA和EMAP分别为0.295 6、0.136 9、0.002 4;而50个随机交易样本的预测误差ERMS、EMA和EMAP分别为0.516 3、0.436 4、0.011 1。这表明随机预测期限的差异并不影响VMD-PSO-LSTM模型的预测性能,模型的随机预测效果具有明显的鲁棒性。其次,相比短期限50个随机交易样本的预测,VMD-PSO-LSTM模型对100个随机样本的预测性能总体较优,预测误差较小。这一结论也进一步印证LSTM模型在拟合并预测较长时期金融时间序列上所具备的优势,即LSTM模型及其混合模型展现出较长时期滞后序列拟合的优势性能。

表5基于随机样本训练的碳价样本外预测效果


3、结 论


本文提出一种融合变分模态分解VMD、PSO优化算法和LSTM模型的多尺度混合碳价预测模型VMD-PSO-LSTM,模型的碳价分解采用完全非递归的求解和变分过程,能有效避免模态混叠和端点效应等传统缺陷,并通过PSO算法提高预测模型的效果。结论如下:

1) 基于VMD变分模态分解的混合碳价模型预测误差和收益预期效果最优,即研究所构建的VMD-PSO-LSTM模型的预测准确度和优越性得到证明。这表明VMD模型的分解优势较显著,更适合刻画复杂非线性非平稳碳价原始信号的多尺度时频特征,据此构造的混合模型拥有较好的性能,能够为投资者研判市场行情、开展量化投资分析、参与碳配额交易等提供技术参考。

2) VMD-PSO-LSTM模型的预测效果并不受随机预测样本期限差异的影响,并在较长随机区间的预测上误差较小,展现出较强的预测鲁棒性和稳定性。


参考文献:

[4]张晨,彭婷,刘宇佳.基于GARCH-分形布朗运动模型的碳期权定价研究[J].合肥工业大学学报(自然科学版),2015,38(11):1553-1558.

[5]胡根华,朱福敏.碳价格波动率模型构建与预测:基于无穷活动率Levy过程[J].数理统计与管理,2018,37(5):892-903.

[6]云坡,唐文之,黄荷暑.基于时变高阶矩NAGARCHSK-LSTM模型的中国碳排放权价格预测[J].安徽农业大学学报(社会科学版),2021,30(5):48-57.

[7]朱帮助,王平,魏一鸣.基于EMD的碳市场价格影响因素多尺度分析[J].经济学动态,2012(6):2-97.

[8]范丽伟,董欢欢,渐令.基于滚动时间窗的碳市场价格分解集成预测研究[J].中国管理科学,2023,31(1):277-286.

[9]崔焕影,窦祥胜.基于EMD-GA-BP与EMD-PSO-LSSVM的中国碳市场价格预测[J].运筹与管理,2018,27(7):133-143.

[10]刘金培,郭艺,陈华友,等.基于非结构数据流行学习的碳价格多尺度组合预测[J].控制与决策,2019,34(2):279-286.

[11]闫梦,王聪.基于多尺度集成模型预测碳交易价格:以广州碳排放交易中心为例[J].技术经济与管理研究,2020(5):19-24.

[12]周熠烜,陈华友,周礼刚,等.基于非结构化数据的LLE-WOA-LSSVR碳价格组合预测模型[J].合肥工业大学学报(自然科学版),2022,45(4):570-576.

[18]于霞,宋杰,段勇,等.基于VMD-GA-BiLSTM的月降水量预测方法[J].沈阳大学学报(自然科学版),2024,36(4):297-305.

[19]赵宏伟.基于改进粒子群算法的云计算资源调度模型的研究[J].沈阳大学学报(自然科学版),2015,27(6):507-511


基金资助:安徽省哲学社会科学规划项目(AHSKQ2022D040);


文章来源:云坡,杨玉.基于VMD混合多尺度机器学习模型的碳排放权价格预测[J].沈阳大学学报(自然科学版),2024,36(05):418-425.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

沈阳大学学报(自然科学版)

期刊名称:沈阳大学学报(自然科学版)

期刊人气:1927

期刊详情

主办单位:沈阳大学

出版地方:辽宁

专业分类:科学

国际刊号:2095-5456

国内刊号:21-1583/N

邮发代号:8-154

创刊时间:1988年

发行周期:双月刊

期刊开本:大16开

见刊时间:10-12个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定