
摘要:针对变桨系统的齿形带断裂故障问题,首先通过分析变桨系统的工作原理,基于多维SCADA信号进行特征数据挖掘,再利用主成分分析法对数据进行预处理,并保留时序信息重构数组,最后利用高斯核支持向量机进行机器学习,实现对齿形带断裂故障的智能检测。结果表明该方法可准确诊断齿形带断裂故障,并已通过多台风电机组监测数据进行验证,准确性可达到98.8%,证明该文所用方法和模型的广泛适用性。研究结果可对未来智慧风电场的开发管理提供有利用价值的工具。
引言
风电机组在长期运作中会伴随着各部件故障频繁发生,采用合理高效的监测手段和准确的故障诊断方法对提高风电机组可靠性具有重要意义。
数据采集与监视控制(SCADA)系统是目前应用于风电行业的主要监控系统,通过采集各项传感器数据反映风力机组的运行状态。相比于状态监测系统(CMS),SCADA系统采样频率较低,但信息记录的周期更长,能够为风电机组故障诊断提供丰富的数据来源[1,2]。目前常见的故障诊断方法有基于模型分析、专家经验知识定性分析、信号处理分析、数字驱动统计分析等[3]。郭鹏等[4]利用SCADA数据,采用非线性估计方法搭建了塔架振动模型,并通过后续分析反映叶轮的运行状态。姚万业等[5]利用相似性原理提取SCADA数据的特征信息,并通过搭建数字驱动的非线性估计模型来评估风电机组运行的健康状况。Zimroz等[6]基于合理算法模型的观点,通过监测不稳定空气负载对变桨距系统稳定性的影响来决策相关停机的情况。文献[7]通过对不同故障的预测和隔离,总结风电机组主轴、齿轮箱、变桨系统及电动机等关键部件的常用故障预测方法。文献[8]通过跟踪检测风电齿轮箱油温温升趋势实现了早期故障诊断,并结合SCADA数据验证诊断的有效性。文献[9]利用机器学习中的人工神经网络(ANN)方法,针对SCADA记录中的警报信号识别变桨系统的异常状态。文献[10]通过对SCADA记录中警报信号,提出2种利用警报信号评估风电机组可靠性的数学分析方法。
目前变桨系统故障诊断的研究主要针对零部件状态监测数据的直接测量分析,以及故障模型的搭建。本文以变桨系统中的SCADA数据作为研究对象,基于主成分分析和整机运行分析提出数据特征挖掘方法,结合支持向量机进行机器学习,并对同类型多台风电机组进行验证,实现变桨系统中齿形带断裂故障的有效诊断。
1、齿形带故障模式
风力发电机组变桨系统是由变桨驱动系统(变桨减速器、变桨电机)、桨叶(叶片、变桨轴承)、齿形带、齿形带支架、变桨控制系统组成。当风速超过额定值时,通过调整叶片桨距角控制风轮转速,使输出功率保持在额定状态;而当风速低于额定风速时桨距角保持设定值。变桨系统的常见故障包括变桨安全链故障、变桨速度超限故障、变桨最小角超限故障、变桨电容电压不平衡故障、变桨电机温度过高故障、变桨充电器反馈丢失故障等[11]。根据变桨系统的工作原理,叶片变桨次数与风速变化频率有关。风电机组的频繁变桨使连接桨叶和变桨电机中的传动部件长期受到交变载荷作用,从而材料疲劳的累计速度很快,最终导致齿形带过早断裂。
2、SCADA数据分析
2.1运行状态分析
本文选取某风场多台1.5MW风电机组海量SCADA数据,主要针对变桨电机拖动桨叶旋转的中间部件齿形带断裂进行研究。由于此类故障无法由SCADA系统原始数据直接表征,本文提取故障风电机组将近1个月(9月9~30日)的数据记录,每条记录均包括风速、发电机转速、输出有功功率、桨叶角度、桨叶速度、变桨电机温度等26个监测项。通常越是接近故障发生前,信号特征表现就越明显。考虑到SCADA数据之间的相关性,分别对风电机组正常运行状态和故障运行状态进行风速-功率曲线绘制,如图1所示。由于风速波动的随机性以及采样数据的离散性,本文将所有数据按照天数划分为不同区间。首先,提取各区间最大风速Vmax和最小风速Vmin,依照IEC标准[12],将[Vmax,Vmin]划分成N等份(N*为正整数),则:
公式1
再将每等份内的数据点求平均值[13]。图1为9月14~17日和9月18~21日采样数据经上述处理之后的风速-功率曲线,并与理论曲线作比较。其中,图1a所示风电机组在实际风速区间下的输出功率与理论曲线较吻合,而图1b中显示实际输出功率曲线低于理论曲线,即风电机组运行异常。考虑到风电机组各故障之间的相互影响,针对齿形带断裂故障形式,需对SCADA数据中的隐含特征做进一步挖掘,实现时域上的及时准确诊断。
图1风速-功率曲线
2.2样本提取及预处理
结合变桨系统的工作原理,以及2.1节划分的区间风电机组的运行状态,选取SCADA数据中的风速、发电机转速、叶片的速度与角度、变桨电机温度、机舱温度、变桨直流电源温度与电流这几个特征量进行分析。考虑到原始样本较大(21000多条记录),以及各参数之间的相关性,采用主成分分析方法进行特征选择。主成分分析法对数据降维表现良好,主要根据方差最大化原理,通过求解一组线性无关且相互正交的向量表征原数据矩阵来寻找累积贡献率较大的特征值,以此利用几个综合指标代表原来众多特征。
主成分分析可能舍弃贡献率小的成分造成样本信息丢失,同时对数据的含义解释模糊,缺乏表达特征完整性的能力。因此本文主要针对3个桨叶的角度、速度、变桨电机温度、充电器温度和电流的不对称数据进行主成分分析,并二次组合以上指标的均值和标准差进行特征提取。为消除不同变量量纲和变化幅度不同带来的影响,原始数据都应该做标准化处理,具体步骤:
步骤1:采集SCADA在线数据,剔除采样值缺省的记录。首先提取除时间之外的18个特征参数,即风速、发电机转速、机舱温度、3个桨叶的速度和角度、3个变桨电机的温度、3个变桨系统直流充电器的温度和直流电流,作[-1,1]归一化处理;
步骤2:设定风速阈值V0=10m/s,划分变桨角度的变化区间[βmin,βmax],其中βmin为风电机组变桨角度初设值0,βmax为正常工作能达到的最大变桨角度;
步骤3:利用主成分方法对不对称数据分析,综合标准化处理的风速、发电机转速、机舱温度数据,最终提取8个特征参量,并按照时序排列;
步骤4:以每分钟内连续10个采集点划分区间,计算各区间的平均值x(i)和标准差σ(i),i代表不同特征参量序号;
步骤5:重复步骤1~步骤4整理风电场多台风电机组数据,按照有无故障发生分类处理。
通过上述方法可有效剔除原始数据中的冗余部分,并在保留数据时序上信息的同时提取表征故障特性的参数。
3、故障识别方法
支持向量机是在传统机器学习理论基础上发展起来的一种机器学习算法,以统计学理论的VC(VapnikChervonenkisdimension)维和结构风险最小化原则为理论依据。其重点在于从训练样本数据中构造最优分类超平面的支持向量,以及样本分类问题的线性或非线性处理,在数学上可归结为求解一个凸二次优化问题。其基本思想可以由图2说明[14]。黑点和白点分别表示2种不同类别的样本点,H为空间上区分这2类的边界分类线,虚线H1和H2分别是通过2类样本中离H最近的样本点且平行于H的直线。支持向量机的目的是寻找合适的边界线H,并确保H到H1、H2之间的分类距离(Margin)最大,由此实现最优分类。其中定义边距H1、H2的最近样本数据点称为支持向量。图中的b代表参数向量,即超平面的法线,w代表分类的阈值。
图2最优分类超平面
由于本文提取的训练样本数据在初始空间中是非线性不可分的,因此需要利用非线性变换φ将输入空间数据映射到更高维的特征向量空间中再构造出最优分类超平面进行分类,最后映射回原始空间中。为解决维数增加导致向量内积运算的困难性,支持向量机引入核函数来代替高维特征空间的内积运算,其结构形式见图3[15]。图中x1,x2,…,xn代表支持向量机的输入特征;K(x1,x),K(x2,x),…,K(xn,x)代表高斯核函数;a1y1,a2y2,…,anyn代表优化约束条件。
图3支持向量机的结构形式
支持向量机的最大特征是利用核函数计算非线性变换的内积,规避了目标函数直接非线性变化的复杂性,从而精简了计算资源。高斯核函数在数据存在噪声时有抗干扰能力,并且可通过调节内部函数参数表现数据的局部特征。在模型训练过程中表现为学习速度快,泛化能力强,不易陷入局部极小值,已成功应用于小样本数据分类、模式判别和图像处理等方面[16]。
高斯核函数的表达形式为:
公式2
式中,(xi,xj)——特征变量,下标i、j代表特征变量的序号,其中i≠j。
引入Lagrange因子αi≥0和惩罚项C∑ξi(ξi为松弛变量,起到容错作用)将文本中的齿形带故障识别转化为带约束条件的优化问题:
公式3
由此解出最优分类函数为:
公式4
由式(4)表明只要找到合适的惩罚系数C及核函数半径δ即可实现分类识别。
4、模型验证
4.1同一风电机组故障识别
本文选取同风场的4台同类型风电机组A1~A4的SCADA数据,其中A1、A2为已发生齿形带断裂故障机组,A3、A4为未发生故障机组。首先提取A1风电机组9月份的21000条记录,利用上述预处理步骤提取故障特征,最终得到4300组数据作为模型输入。其中预处理后的齿形带工作异常区间为[2729,3299],其他区间变桨系统均运行正常。将变桨正常状态设定标签为0,故障异常状态设为标签1。取惩罚系数C的变化范围为[-0.5,0.5],高斯核函数半径δ的变化范围为[-2,2]。
本文利用以上数据建立基于高斯核函数的支持向量机模型。机器学习中往往会出现训练模型准确率很高,但测试集验证准确性不高的现象。其主要原因主要有训练数据中2类情况的特征不明显,预处理数据结果空间分布不平衡及测试集中2类分布比例相较于训练集不均,由此导致模型训练过拟合或欠拟合。为优化数据构建的训练模型,本文针对预处理得到的训练数据采用K折交叉验证处理。其主要思想为:对数据样本X分割成K个子样本,每个单独的子样本K被保留作为验证模型的数据,其余K-1个样本重构训练组来产生模型;重复K次交叉验证,通过判断各子样本验证准确率来衡量模型的稳定性。对训练数据组分层抽样,随机分组引入10折交叉验证,并同时保证同组正常标签与故障标签的比例相同。经多次训练计算,选取惩罚系数C=1.4,核函数半径δ=4。最后测试集引入模型进行检验,故障预测标签如图4所示。
图4表明利用高斯核函数支持向量机模型能有效识别A1风电机组变桨系统齿形带故障区间。预测输出区间为[2734,3299],这与上述实际转化区间[2729,3299]齿形带断裂。从图4b图局部放大中可看出部分实际情况为异常的数据点被误判断为正常,而在变桨正常工作区间内也有少数测试点诊断错误。这是由于数据本身在故障状态下与正常状态特征不明显所致,同时在预处理阶段采用求取平均值的方法,一定程度上弱化了2种情况的特征差异。
图4A1风电机组变桨故障识别
4.2不同风电机组故障识别
为考察模型的泛化能力以及稳定性,对同风场其他3台风电机组A2、A3、A4的监测数据进行整理验证。将预处理步骤5中得到的数据分层抽样并按照时序排列。采用相同的惩罚系数和核函数半径,同时用A1风电机组机器学习模型进行交叉验证。模型训练各测试数组的结果如表1和图5所示。图5中的结果均为识别标签,为判断故障诊断模型的预测准确性,将标签区间回归到各机组原始SCADA数据中,并与实际断裂故障发生点作比较。预测准确率及误判样本点总数见表1。结合图5和表1中的结果表明本文对SCADA数据的处理方法能较好地预测出不同风电机组的变桨系统故障发生区间,并且通过不同机组之间的交叉验证证明模型具有一定的泛化能力。在计算速度方面,该方法构建训练模型迅速,占用计算机资源较少。
表1支持向量机预测结果
图5不同风电机组变桨故障识别
5、结论
本文利用SCADA检测数据,利用机器学习方法实现风力机组变桨系统齿形带断裂故障监测。通过主成分分析法提取原始海量数据主要特征,再结合变桨系统工作机理重组训练样本,以高斯核支持向量机建立预测模型,实现由检测数据判别齿形带是否发生断裂故障。本文采用的方法特点为:
1)利用主成分分析对多尺度数据降维,结合风电机组运行状态分析,重组SCADA数据,同时保留故障特征信息和信号时序上隐含的信息。相较于仅采用主成分分析的方法,弱化了剔除贡献率小但包含样本差异重要信息数组的不足,为时域连续数据预处理提供有效方法。
2)采用高斯核支持向量机监督学习,验证齿形带断裂故障预测的可行性,并论证该方法具有计算速度快,占用资源少等优点。
3)本文实现的故障诊断方法,首先通过某一故障机型实现数据训练,其后通过多台同类型故障风电机组和健康机组进行横向验证,量化了监测的准确性,监测结果证明模型具有一定的泛化能力。
该研究结果对降低故障诊断成本,实现未来智慧风电场的管理提供了一定的参考方法和工具。
参考文献:
[4]郭鹏,徐明,白楠,等.基于SCADA运行数据的风电机组塔架振动建模与监测[J].中国电机工程学报,2013,33(5):128-135.
[5]姚万业,李新丽.基于状态监测的风电机组变桨系统故障诊断[J].可再生能源,2016,34(5):437-440.
[11]张红义,呼木吉乐图,王冰,等.金风1.5MW风机Vensys变桨系统安全链故障处理[J].内蒙古石油化工,2015(9):71-73.
[15]高文军.基于人工免疫算法优化支持向量机的电力变压器故障诊断研究[D].太原:太原理工大学,2012.
[16]刘德鹏,李刚,张宏亮,等.基于RBF核支持向量机的轴箱磨损状态诊断系统[J].电子科技,2017(5):150-153.
熊中杰,邱颖宁,冯延晖,程强.基于机器学习的风电机组变桨系统故障研究[J].太阳能学报,2020,41(05):85-90.
分享:
多电飞机是未来飞行器发展的重要方向,而多电航空发动机(More Electric Engine,MEE)的性能直接决定了飞机的整体性能。多电发动机的核心部件主要有:磁悬浮轴承系统、内置式整体起动/发电机、电驱动燃油泵、分布式控制系统,其中前两者一般都直接安装在高压转子上,对转子运行有直接影响。
2024-12-04在以航空发动机为代表的高速旋转机械中,齿轮是核心传动元件,用于保证不同转速的部件互相匹配并高效传递功率,其可靠性至关重要。一旦齿轮发生故障,将直接影响航空发动机的使用安全,轻则会使系统振动增大、传动失效,严重时甚至会导致灾难性事故。某型起动机发生两起减速器输入主动齿轮断齿故障,一起起动机自由涡轮盘甩出,险些酿成大祸。
2024-12-04工程教育专业认证可以有效保障工程教育的质量。教育部发布的《关于一流本科课程建设的实施意见》提出,课程目标要坚持知识、能力、素质有机融合,培养学生解决复杂问题的综合能力和高级思维,这对高校理工科学生的工程实践能力与创新意识提出了明确的目标。
2024-11-11纯电轻卡是一种利用电池作为动力源,通过电机驱动轮胎运行的载重型车辆,具有节能、环保、低噪音等优点。随着新能源汽车技术的发展和政策的支持,纯电轻卡在我国市场上得到了快速的推广和应用。然而,纯电轻卡作为一种重载运输工具,在复杂的道路条件下运行,对驱动系统提出了较高的要求。
2024-10-23随着我国国民经济的发展及电网峰谷差的逐渐加大,大型火电机组已普遍参与调峰运行。机组在担负调峰任务时,通常需要频繁的启停,热态启动次数较多,转子和汽缸由此受到冷热冲击进而严重影响汽轮机的使用寿命。因此,对于汽轮机的热态启动,关键要解决汽轮机主蒸汽温度和汽轮机转子、汽缸温度之间的匹配问题。
2024-10-17随着我国电力需求的增长与能源绿色低碳转型,以及电力系统结构逐步改变,电力系统面临巨大挑战。短期负荷预测是电网日常调度的重要依据,其预测精确度的需求也变得更高。目前,负荷预测的方法主要分为机器学习和深度学习。在进行负荷预测时,应有效地考虑负荷与过去的负荷值之间复杂的相关性。
2024-10-08风电机组的随机性和间歇性会影响电网的稳定性和可靠性。对风电机组的实时风速、功率参数进行精确测量,可以为风电场经济稳定、合理地实施调控决策奠定基础。然而,风电机组停机、减负荷、通信噪声、装置失效等原因,使风电机组出现了大量的异常运行数据。因此,需要对风电机组异常数据点进行筛选。
2024-09-20在“双碳”的背景下,以光伏、风电为代表的分布式电源得到广泛应用,并通过电力电子设备接入电力系统。分布式电源具有响应快、安全灵活等优点,但由于缺乏惯性,随着电力电子设备渗透率的提高,必然会降低电力系统的惯性阻尼。此外,由于其输出的不确定性和间歇性,系统的稳定性将受到威胁。
2024-09-20近几年新能源乘用车市场占有率不断提升,电动化成为了汽车技术发展的主流趋势,尤其以“蔚小理”等为代表的造车新势力,将纯电动车技术不断推向高端化、智能化、网联化的新发展态势。为了满足用户对纯电动汽车加速性能好、续航里程高、充电速率快、成本低等需求,电驱动技术也朝着高功率密度、高效率、高转速等方向发展。
2024-09-20水轮发电机组是水电站实现效益的核心设备,厂房作为保障机组运行的重要建筑,受振动影响可能发生共振,甚至导致局部构件损坏,这直接关系到电站的安全运行。因此,对电站厂房结构进行振动分析十分必要。马震岳等对三峡水电站厂房结构进行了动力分析,发现厂房振动频率较低且密集,机组转频和水轮机尾水管涡带频率接近厂房结构的基频和第二阶频率。
2024-09-19人气:8098
人气:4425
人气:3210
人气:1441
人气:1258
我要评论
期刊名称:上海电力学院学报
期刊人气:701
主管单位:上海市教育委员会
主办单位:上海电力学院
出版地方:上海
专业分类:电力
国际刊号:1006-4729
国内刊号:31-1518/TM
创刊时间:1980年
发行周期:双月刊
期刊开本:大16开
见刊时间:4-6个月
影响因子:0.814
影响因子:1.445
影响因子:0.657
影响因子:0.000
影响因子:0.688
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!