摘要:利用无人机多光谱反射率影像和同步实测水质数据,建立基于机器学习的水质参数反演模型,并将该模型应用于张家港河。结果表明,基于XGBoost和随机森林的特征变量重要性分析方法选择氨氮反演的最佳波段组合,确定用随机森林进行氨氮反演精度较高,其测试集决定系数为0.91,平均绝对百分比误差为23.57%;反演结果能从空间上精细地反映张家港河光明村段支流水质的特点,并直观展示水质超标重点区域。
加入收藏
张家港河位于太湖流域,是苏州和无锡通往上海的通江河道。张家港河北部污染企业集中,上游来水水质较差[1],大义光明村地表水省级考核断面存在水质波动,考核未达标现象时有发生[2]。水质自动站在水质空间分布表征上限制性强,虽然卫星遥感在黑臭河道监测[3-4]、水质反演[5]中得到了一定应用,但张家港河各支流河宽为10 m ~ 20 m, 受制于空间分辨率,应用限制性高。无人机遥感作为一种新型监测手段,具有空间分辨率高、成本相对低、响应能力快等特点,将无人机和机器学习技术应用于湖泊和河道水质监测是未来重点研究方向[6-7]。
平原水网地区地表水体光学特性复杂[8-9],利用遥感技术反演叶绿素a[10]、悬浮物[11-12]、黄色物质[13]等水色参数效果良好,而总磷、总氮、化学需氧量等指标却不存在显著的光学特性,须分析其与水体中不同物质间的相互关系再进行间接分析[14],这要求选择与实测值关联性最大的波段或波段组合作为模型输入因子,以提高模型拟合能力。现有研究主要采用Pearson系数进行波段筛选[15-16],难以深入挖掘光谱特征与水质参数的非线性关系。在反演模型的构建上,虽然线性回归[17-19]应用最为广泛,但其在非光学活性指标的拟合上限制性强。支持向量机[20]、XGBoost[15,21]、高斯过程[16]、径向基神经网络[22]等算法虽不能改变反演模型整体框架,却能够显著提升模型拟合能力,是解决非线性回归问题的有效途径。今基于无人机多光谱影像和同步采集的水质监测数据,采用特征重要性确定反演模型自变量,构建基于机器学习的反演模型,并在张家港河光明村段进行应用研究。
1、数据与方法
1.1 研究区概况
研究区域(E120°38′45″ ~ E120°42′43″,N31°42′3″ ~ N31°43′15″)位于常熟市,河流总长度9.7 km, 包括张家港河光明村段(2.3 km)及其支流四新河(5.5 km)和五星河(1.9 km)。四新河和五星河汇入张家港河后,由北向南流出研究区。该区域内存在纺织印染、机械制造集聚区,以及五新花园、小义新村等拆迁安置生活区,局部区域氨氮(NH3-N)超标可能性高。
1.2 数据来源
无人机影像:采用大疆经纬M300 RTK型无人机和六通道成像光谱仪(450 nm ~ 720 nm),结合下行光传感器和标准反射率定标板,获取航摄河道及其两岸光谱反射率影像数据,无人机影像空间分辨率为0.19 m。无人机飞行作业时应避开中午太阳直射引起的水体镜面反射现象,太阳高度角30° ~ 60°是水体遥感监测的合理区间段[23]。四新河中部区域存在大量高大乔木,当太阳高度角过低时,其在水面上会存在树木倒影,从而影响水体的光谱特征,须根据太阳高度角选择适当的无人机飞行作业时间,避免由于太阳高度角过低而导致的水体中倒影现象。本研究中无人机作业时间为2022年9月7日上午9时—11时,作业时天空晴朗、水面平静。
监测数据:在无人机飞行作业时,利用500 mL塑料采样瓶同步进行地面水质采样,并记录点位经纬度信息,采样位置为河道中心线,采样水深为0.5 m。监测指标为NH3-N,水样采集完毕密封保存,并及时送实验室分析,测定方法参考文献[24]。共设采样点28个,其中20个点位数据作为训练集参与模型构建,剩余8个点位数据作为测试集用于精度验证,采样点类型及分布见图1。
图1正射影像和采样点分布
1.3 研究方法
1.3.1 影像预处理
无人机飞行前利用定标板采集标准反射率数据,对无人机影像进行辐射校正、正射校正和影像镶嵌,最终得到地表反射率正射影像数据。对正射影像进行人工检查,剔除存在河岸树木水面倒影和船只区域,只保留纯净水面影像。
1.3.2 特征变量选择
研究表明,采用单波段建立的水质参数反演模型无法精确反映波段与水质参数之间的关系[14],采用波段比值可以部分消除大气和镜面反射的干扰,并在一定程度上减小悬浮物、黄色物质等污染物的影响[25]。同时,考虑到遥感光谱特征与水质参数之间并不是简单的线性关系,基于机器学习的特征变量重要性分析在回归模型的构建中具有良好的应用效果[26]。因此,本研究以地表反射率数据为基础,构建波段间的两两比值为自变量,水质参数作为因变量,进行特征变量选择。
1.3.3 反演模型构建
共取得无人机对地观测时的地面同步实测NH3-N数据28组,为保证测试样本分布的合理性,训练集和测试集按照7∶3的比例,在28组水质监测数据中按浓度递增方式均匀选取。以最优特征变量作为自变量,NH3-N实测值作为因变量,采用随机森林、XGBoost、支持向量机、KNN、提升树、极端树等算法建立水质反演模型,模型构建方法详见文献[27-29]。
1.3.4 精度验证
采用决定系数(R2)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)进行模型精度验证。其中,MAE指所有估计值与实测值之间的绝对误差的平均值,MAPE指所有估计值与实测值之间的相对误差的平均值。计算公式如下:
式中:m为样本数;yi为实测值;
为预测值;
为样本实测值的均值。
2、结果与讨论
2.1 特征变量分析
基于影像反射率数据,以无人机影像b1 ~ b6波段间的两两比值作为自变量,NH3-N采样实测值作为因变量,采用XGBoost和随机森林算法计算各个自变量的相对重要程度,重要性前十的变量见表1。由表1可知,基于XGBoost算法的NH3-N重要性前五的特征变量为b1/b4、b4/b6、b1/b3、b5/b6和b1/b2,随机森林算法为b1/b4、b4/b6、b4/b5、b1/b3和b2/b4,其中,b1/b4、b4/b6和b1/b3为两种算法共有的特征变量。XGBoost和随机森林算法所确定的水质参数反演模型特征变量基本一致,二者能够挖掘模型自变量与水质参数的内在关联,故采用上述3个共有特征变量构建水质参数反演模型。
表1自变量相对重要程度
2.2 模型评价与验证
采用R2、MAE和MAPE对测试集进行精度验证,结果见表2。
表2测试集NH3-N反演验证结果
由表2可知,虽然基于支持向量机的NH3-N反演模型MAPE最低(22.82%),但模型稳定性一般,表现为R2低于随机森林,MAE高于随机森林。相较于常规的线性回归模型,基于机器学习的反演模型精度得到了极大提高,其中随机森林表现最佳,R2由0.51提升至0.91,MAE由0.55 mg/L降为0.27 mg/L,MAPE由48.61%降为23.57%。综合来看,基于随机森林的NH3-N预测值和实测值的拟合效果最好,反演模型综合性能最优。从NH3-N反演模型精度来看,相较于Chen等[15]的研究成果(R2=0.694),本研究通过特征选择方法确定了反演模型的输入变量,提高了反演精度。机器学习模型在NH3-N反演上表现出较强的拟合能力和较高的预测精度,这与庞吉玉等[21]的研究结果一致。
2.3 空间分布特征
基于上述分析结果,利用构建好的随机森林模型进行NH3-N反演,结果见图2(a)(b)(c)(d)(e)。从空间分布上看,虽然张家港河光明村段NH3-N整体为Ⅲ类,满足地表水省级考核要求,但其支流水质较差,局部区域为劣Ⅳ类水,主要分布在四新河西部的工厂聚集区[见图2(b)]和东部的生活区[见图2(c)],以及五星河中部和东部的工厂集聚区[见图2(d)(e)],在支流汇入张家港河处,存在污染“拖尾”现象。这表明无人机水质反演结果能够快速从空间上精细地反映张家港河光明村段支流水质差的特点,下一步可根据反演结果对支流中涉及的水质超标重点区域开展污染溯源工作。
图2 2022年9月7日张家港河光明村段NH3-N分布
有研究表明,在自然水体中,浊度对于NH3-N值的影响并不大[30]。在本研究中,浊度高值区和NH3-N高值区分布基本一致,主要位于四新河东西两侧[见图2(b)(c)],以及五星河中部和东部[见图2(d)(e)],这可能是由于该区域排口数量较多,上游来水量大引起水体混浊,带来更多的污染物。需要注意的是,无人机搭载成像光谱仪采集水体反射率进行NH3-N反演,由于水体浊度变化而导致的光谱反射率变化必然会对NH3-N反演产生一定影响。后续研究中可将浊度数据作为自变量加入NH3-N反演模型中,同时增加飞行架次和采样点位,避免应用复杂模型时出现过拟合现象,进一步提高模型反演精度。此外,不同河道的水体光谱特征差异较大,在进行无人机水质反演应用时,如何提高模型泛化能力,是下一步研究的重要方向。
3、结语
本研究在张家港河光明村段采集无人机多光谱反射率正射影像和同步实测NH3-N采样监测数据,在特征选择的基础上建立了基于机器学习的NH3-N反演模型,并在张家港河光明村段进行了应用,分析NH3-N的空间分布特征。
(1)利用无人机搭载光谱仪进行水质遥感监测时须按照太阳高度角合理安排飞行时间,避免水面倒影和水体镜面反射影响成像质量。此外,应保证充足的采样点用于反演模型构建,并重视水色指标对光谱特征的干扰,以降低其对非光学活性指标反演建模的影响。
(2)XGBoost和随机森林算法所确定的反演模型特征变量基本一致,二者能够挖掘模型自变量与水质参数的内在关联,特征重要性分析方法能够为水质参数反演模型的特征变量选择提供支撑。
(3)机器学习模型在NH3-N反演上表现出较强的拟合能力和较高的预测精度,基于随机森林算法的NH3-N反演模型精度较高,其在小样本的水质参数反演上具有一定优势。
基于无人机多光谱影像的水质参数反演方法在张家港河光明村段具有良好的应用效果,能够快速精细地反映张家港河光明村段支流水质差的特征,为下一步污染溯源提供重点排查区域。
参考文献:
[1]刘洋,姚敏,辛玉婷,等.阳澄湖水污染成因分析及整治对策研究[J].污染防治技术,2014,27(4):55-59.
[2]苏州市人民政府.苏州市通报全市考核断面水质状况[EB/OL].[2021-03-02].
[3]申茜,朱利,曹红业.城市黑臭水体遥感监测与筛查研究进展[J].应用生态学报,2017,28(10):3433-3439.
[4]姚月,申茜,朱利,等.高分二号的沈阳市黑臭水体遥感识别[J].遥感学报,2019,23(2):230-242.
[5]赵慈,沈鹏,李倩,等.基于GF-1 WFV影像和随机森林算法的总氮反演研究[J].环境科学与技术,2021,44(9):23-30.
[7]丁铭,李旭文,姜晟,等.基于无人机高光谱遥感在太湖蓝藻水华监测中的一次应用[J].环境监测管理与技术,2022,34(1):49-51.
[8]张兵,李俊生,申茜,等.长时序大范围内陆水体光学遥感研究进展[J].遥感学报,2021,25(1):37-52.
[9]王思梦,秦伯强.湖泊水质参数遥感监测研究进展[J].环境科学,2023,44(3):1228-1243.
[10]吴志杰,董世元,何炜琪,等.基于特征选择和机器学习的阳澄湖叶绿素a遥感反演研究[J].环境监测管理与技术,2022,34(1):27-32.
[11]黄昕晰,应晗婷,夏凯,等.基于无人机多光谱影像和OPT-MPP算法的水质参数反演[J].环境科学,2020,41(8):3591-3600.
[12]赵冉,杨凤芸,孟庆岩,等.GF-1与GF-6 WFV影像在滇池悬浮物浓度反演中的对比分析[J].光谱学与光谱分析,2023,43(1):198-205.
[17]李恩.基于无人机高光谱的氮磷含量反演方法研究[D].大连:大连海事大学,2020.
[18]章佩丽,宋亮楚,王昱,等.基于无人机多光谱的城市水体典型河道水质参数反演模型构建[J].环境污染与防治,2022,44(10):1351-1356.
[19]杨振,卢小平,武永斌,等.无人机高光谱遥感的水质参数反演与模型构建[J].测绘科学,2020,45(9):60-64.
[20]李爱民,许有成,王海隆,等.粒子群算法优化SVR的天德湖总氮遥感反演[J].环境监测管理与技术,2023,35(6):22-27.
基金资助:国家重点研发计划基金资助项目(No.2020YFC1807402); 南京市水务科技基金资助项目(202307);
文章来源:何炜琪,吴志杰,王紫安.基于无人机多光谱影像的城市河道水质反演[J].环境监测管理与技术,2024,36(05):51-55.
分享:
随着经济发展水平的不断提高,中国的畜禽生产得到了快速发展,但畜禽养殖带来的粪污排放问题也随之产生。畜禽粪便富含有机质及多种无机营养元素,对提升土壤肥力的效果显著,是一种优质的有机肥料。然而,在畜禽饲养过程中,由于养殖户一味追求高剂量的重金属元素饲料所产生的生理作用[1]。
2025-09-04据开阳县农业农村局统计,全县近5年内无重大畜禽污染事件发生,2024年生态环保督查全县反馈畜禽污染投诉案件仅有2个、“12345”平台信访投诉共10件,均为历史最低值。本文对开阳县的畜禽粪污综合治理模式进行总结分析,针对存在的主要问题提出对策建议,供同行参考。
2025-08-29交通领域在城镇化和机动化推动下,碳排放增速显著。城市建成区扩张使居民出行需求大增,未来交通碳排放量预计持续上升,给“双碳”目标实现带来挑战。而且,交通运输行业因移动源分散等特性,碳排放监测、管控难度大,是“双碳”目标的关键攻坚领域,其低碳转型成效关乎国家绿色发展进程。
2025-08-28激光散射法是一种非接触式的粒子测量技术,广泛应用于环境监测、工业粉尘控制等领域。其基本原理基于Mie散射理论。与Rayleigh散射仅适用于远小于波长的粒子不同,Mie散射理论适用于粒子直径与光波波长相当甚至更大的粒子,因此在PM2.5、PM10等粉尘测量中更为适用。
2025-08-282020年8月,长三角一体化发展座谈会上习近平总书记着重指出,必须推动城乡有机废弃物的有效处理与利用,并建立一系列相应的保障体系。作为有机废弃物的重要组成部分,园林绿化垃圾的资源化管理和利用,是积极响应国家碳中和、生态文明及绿色发展号召的关键途径,对于减轻垃圾处置负担、保持生态平衡具有重大意义[1]。
2025-08-17无论是退化林还是处于非正常演替阶段的森林,如果仅依靠自然力量恢复,其进程将很漫长。因此,在遵循自然规律的前提下,科学利用自然力,加以适当的人为干预,则会加快森林正向演替进程,充分利用林地生产力,恢复稳定和健康的森林生态系统。
2025-08-17在我国乡村振兴战略深入实施的背景下,绿色产业作为促进乡村经济转型和生态文明建设的重要途径,受到了广泛关注。乡村绿色产业振兴不仅有助于解决农村经济结构单一、环境污染等问题,还能够推动生态环境保护,实现经济、社会与生态效益的有机统一。
2025-08-10新质生产力是具有技术密集型和高效率及高质量发展特征的现代生产力形态,其创新驱动内核与低碳转型需求形成深度耦合机制[2]。新质生产力突出技术创新的引领作用,同时,重视生产要素的创新性配置以及产业结构的深度转型升级。这些特性都为“双碳”目标的达成提供了坚实的理论基础和切实可行的实践路径。
2025-07-16生态环境是人类赖以生存和发展的基础,其质量直接影响区域可持续发展。当前,随着经济社会的快速发展,生态环境问题日益突出,对区域可持续发展构成严重威胁。因此,开展区域生态环境综合质量评价,探讨其与区域可持续发展的关系,对协调经济发展与生态保护,实现区域可持续发展具有重要意义。
2025-07-15随着经济发展与人民群众对高质量生态环境的需求愈发迫切,如何提升基层生态环境执法能力,强化生态环境管理已成为全社会探讨的热门话题。在具体实践过程中,基层生态环境执法部门须提升对执法工作全过程的重视程度,始终坚持落实习近平生态文明思想,全面增强执法力度,进而实现生态环境质量全面优化提升。
2025-07-14人气:3855
人气:3381
人气:2985
人气:2631
人气:2369
我要评论
期刊名称:环境监测管理与技术
期刊人气:1737
主管单位:江苏省环境保护厅
主办单位:环境监测中心,南京市环境监测中心站
出版地方:江苏
专业分类:环境
国际刊号:1006-2009
国内刊号:32-1418/X
邮发代号:28-341
创刊时间:1989年
发行周期:双月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:1.587
影响因子:0.566
影响因子:1.350
影响因子:0.000
影响因子:0.932
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!