91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于无人机多光谱影像的城市河道水质反演

  2024-10-22    54  上传者:管理员

摘要:利用无人机多光谱反射率影像和同步实测水质数据,建立基于机器学习的水质参数反演模型,并将该模型应用于张家港河。结果表明,基于XGBoost和随机森林的特征变量重要性分析方法选择氨氮反演的最佳波段组合,确定用随机森林进行氨氮反演精度较高,其测试集决定系数为0.91,平均绝对百分比误差为23.57%;反演结果能从空间上精细地反映张家港河光明村段支流水质的特点,并直观展示水质超标重点区域。

  • 关键词:
  • 反演模型
  • 多光谱影像
  • 无人机
  • 氨氮
  • 水质
  • 加入收藏

张家港河位于太湖流域,是苏州和无锡通往上海的通江河道。张家港河北部污染企业集中,上游来水水质较差[1],大义光明村地表水省级考核断面存在水质波动,考核未达标现象时有发生[2]。水质自动站在水质空间分布表征上限制性强,虽然卫星遥感在黑臭河道监测[3-4]、水质反演[5]中得到了一定应用,但张家港河各支流河宽为10 m ~ 20 m, 受制于空间分辨率,应用限制性高。无人机遥感作为一种新型监测手段,具有空间分辨率高、成本相对低、响应能力快等特点,将无人机和机器学习技术应用于湖泊和河道水质监测是未来重点研究方向[6-7]。

平原水网地区地表水体光学特性复杂[8-9],利用遥感技术反演叶绿素a[10]、悬浮物[11-12]、黄色物质[13]等水色参数效果良好,而总磷、总氮、化学需氧量等指标却不存在显著的光学特性,须分析其与水体中不同物质间的相互关系再进行间接分析[14],这要求选择与实测值关联性最大的波段或波段组合作为模型输入因子,以提高模型拟合能力。现有研究主要采用Pearson系数进行波段筛选[15-16],难以深入挖掘光谱特征与水质参数的非线性关系。在反演模型的构建上,虽然线性回归[17-19]应用最为广泛,但其在非光学活性指标的拟合上限制性强。支持向量机[20]、XGBoost[15,21]、高斯过程[16]、径向基神经网络[22]等算法虽不能改变反演模型整体框架,却能够显著提升模型拟合能力,是解决非线性回归问题的有效途径。今基于无人机多光谱影像和同步采集的水质监测数据,采用特征重要性确定反演模型自变量,构建基于机器学习的反演模型,并在张家港河光明村段进行应用研究。


1、数据与方法


1.1 研究区概况

研究区域(E120°38′45″ ~ E120°42′43″,N31°42′3″ ~ N31°43′15″)位于常熟市,河流总长度9.7 km, 包括张家港河光明村段(2.3 km)及其支流四新河(5.5 km)和五星河(1.9 km)。四新河和五星河汇入张家港河后,由北向南流出研究区。该区域内存在纺织印染、机械制造集聚区,以及五新花园、小义新村等拆迁安置生活区,局部区域氨氮(NH3-N)超标可能性高。

1.2 数据来源

无人机影像:采用大疆经纬M300 RTK型无人机和六通道成像光谱仪(450 nm ~ 720 nm),结合下行光传感器和标准反射率定标板,获取航摄河道及其两岸光谱反射率影像数据,无人机影像空间分辨率为0.19 m。无人机飞行作业时应避开中午太阳直射引起的水体镜面反射现象,太阳高度角30° ~ 60°是水体遥感监测的合理区间段[23]。四新河中部区域存在大量高大乔木,当太阳高度角过低时,其在水面上会存在树木倒影,从而影响水体的光谱特征,须根据太阳高度角选择适当的无人机飞行作业时间,避免由于太阳高度角过低而导致的水体中倒影现象。本研究中无人机作业时间为2022年9月7日上午9时—11时,作业时天空晴朗、水面平静。

监测数据:在无人机飞行作业时,利用500 mL塑料采样瓶同步进行地面水质采样,并记录点位经纬度信息,采样位置为河道中心线,采样水深为0.5 m。监测指标为NH3-N,水样采集完毕密封保存,并及时送实验室分析,测定方法参考文献[24]。共设采样点28个,其中20个点位数据作为训练集参与模型构建,剩余8个点位数据作为测试集用于精度验证,采样点类型及分布见图1。

图1正射影像和采样点分布

1.3 研究方法

1.3.1 影像预处理

无人机飞行前利用定标板采集标准反射率数据,对无人机影像进行辐射校正、正射校正和影像镶嵌,最终得到地表反射率正射影像数据。对正射影像进行人工检查,剔除存在河岸树木水面倒影和船只区域,只保留纯净水面影像。

1.3.2 特征变量选择

研究表明,采用单波段建立的水质参数反演模型无法精确反映波段与水质参数之间的关系[14],采用波段比值可以部分消除大气和镜面反射的干扰,并在一定程度上减小悬浮物、黄色物质等污染物的影响[25]。同时,考虑到遥感光谱特征与水质参数之间并不是简单的线性关系,基于机器学习的特征变量重要性分析在回归模型的构建中具有良好的应用效果[26]。因此,本研究以地表反射率数据为基础,构建波段间的两两比值为自变量,水质参数作为因变量,进行特征变量选择。

1.3.3 反演模型构建

共取得无人机对地观测时的地面同步实测NH3-N数据28组,为保证测试样本分布的合理性,训练集和测试集按照7∶3的比例,在28组水质监测数据中按浓度递增方式均匀选取。以最优特征变量作为自变量,NH3-N实测值作为因变量,采用随机森林、XGBoost、支持向量机、KNN、提升树、极端树等算法建立水质反演模型,模型构建方法详见文献[27-29]。

1.3.4 精度验证

采用决定系数(R2)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)进行模型精度验证。其中,MAE指所有估计值与实测值之间的绝对误差的平均值,MAPE指所有估计值与实测值之间的相对误差的平均值。计算公式如下:

式中:m为样本数;yi为实测值;

为预测值;

为样本实测值的均值。


2、结果与讨论


2.1 特征变量分析

基于影像反射率数据,以无人机影像b1 ~ b6波段间的两两比值作为自变量,NH3-N采样实测值作为因变量,采用XGBoost和随机森林算法计算各个自变量的相对重要程度,重要性前十的变量见表1。由表1可知,基于XGBoost算法的NH3-N重要性前五的特征变量为b1/b4、b4/b6、b1/b3、b5/b6和b1/b2,随机森林算法为b1/b4、b4/b6、b4/b5、b1/b3和b2/b4,其中,b1/b4、b4/b6和b1/b3为两种算法共有的特征变量。XGBoost和随机森林算法所确定的水质参数反演模型特征变量基本一致,二者能够挖掘模型自变量与水质参数的内在关联,故采用上述3个共有特征变量构建水质参数反演模型。

表1自变量相对重要程度

2.2 模型评价与验证

采用R2、MAE和MAPE对测试集进行精度验证,结果见表2。

表2测试集NH3-N反演验证结果

由表2可知,虽然基于支持向量机的NH3-N反演模型MAPE最低(22.82%),但模型稳定性一般,表现为R2低于随机森林,MAE高于随机森林。相较于常规的线性回归模型,基于机器学习的反演模型精度得到了极大提高,其中随机森林表现最佳,R2由0.51提升至0.91,MAE由0.55 mg/L降为0.27 mg/L,MAPE由48.61%降为23.57%。综合来看,基于随机森林的NH3-N预测值和实测值的拟合效果最好,反演模型综合性能最优。从NH3-N反演模型精度来看,相较于Chen等[15]的研究成果(R2=0.694),本研究通过特征选择方法确定了反演模型的输入变量,提高了反演精度。机器学习模型在NH3-N反演上表现出较强的拟合能力和较高的预测精度,这与庞吉玉等[21]的研究结果一致。

2.3 空间分布特征

基于上述分析结果,利用构建好的随机森林模型进行NH3-N反演,结果见图2(a)(b)(c)(d)(e)。从空间分布上看,虽然张家港河光明村段NH3-N整体为Ⅲ类,满足地表水省级考核要求,但其支流水质较差,局部区域为劣Ⅳ类水,主要分布在四新河西部的工厂聚集区[见图2(b)]和东部的生活区[见图2(c)],以及五星河中部和东部的工厂集聚区[见图2(d)(e)],在支流汇入张家港河处,存在污染“拖尾”现象。这表明无人机水质反演结果能够快速从空间上精细地反映张家港河光明村段支流水质差的特点,下一步可根据反演结果对支流中涉及的水质超标重点区域开展污染溯源工作。

图2 2022年9月7日张家港河光明村段NH3-N分布

有研究表明,在自然水体中,浊度对于NH3-N值的影响并不大[30]。在本研究中,浊度高值区和NH3-N高值区分布基本一致,主要位于四新河东西两侧[见图2(b)(c)],以及五星河中部和东部[见图2(d)(e)],这可能是由于该区域排口数量较多,上游来水量大引起水体混浊,带来更多的污染物。需要注意的是,无人机搭载成像光谱仪采集水体反射率进行NH3-N反演,由于水体浊度变化而导致的光谱反射率变化必然会对NH3-N反演产生一定影响。后续研究中可将浊度数据作为自变量加入NH3-N反演模型中,同时增加飞行架次和采样点位,避免应用复杂模型时出现过拟合现象,进一步提高模型反演精度。此外,不同河道的水体光谱特征差异较大,在进行无人机水质反演应用时,如何提高模型泛化能力,是下一步研究的重要方向。


3、结语


本研究在张家港河光明村段采集无人机多光谱反射率正射影像和同步实测NH3-N采样监测数据,在特征选择的基础上建立了基于机器学习的NH3-N反演模型,并在张家港河光明村段进行了应用,分析NH3-N的空间分布特征。

(1)利用无人机搭载光谱仪进行水质遥感监测时须按照太阳高度角合理安排飞行时间,避免水面倒影和水体镜面反射影响成像质量。此外,应保证充足的采样点用于反演模型构建,并重视水色指标对光谱特征的干扰,以降低其对非光学活性指标反演建模的影响。

(2)XGBoost和随机森林算法所确定的反演模型特征变量基本一致,二者能够挖掘模型自变量与水质参数的内在关联,特征重要性分析方法能够为水质参数反演模型的特征变量选择提供支撑。

(3)机器学习模型在NH3-N反演上表现出较强的拟合能力和较高的预测精度,基于随机森林算法的NH3-N反演模型精度较高,其在小样本的水质参数反演上具有一定优势。

基于无人机多光谱影像的水质参数反演方法在张家港河光明村段具有良好的应用效果,能够快速精细地反映张家港河光明村段支流水质差的特征,为下一步污染溯源提供重点排查区域。


参考文献:

[1]刘洋,姚敏,辛玉婷,等.阳澄湖水污染成因分析及整治对策研究[J].污染防治技术,2014,27(4):55-59.

[2]苏州市人民政府.苏州市通报全市考核断面水质状况[EB/OL].[2021-03-02].

[3]申茜,朱利,曹红业.城市黑臭水体遥感监测与筛查研究进展[J].应用生态学报,2017,28(10):3433-3439.

[4]姚月,申茜,朱利,等.高分二号的沈阳市黑臭水体遥感识别[J].遥感学报,2019,23(2):230-242.

[5]赵慈,沈鹏,李倩,等.基于GF-1 WFV影像和随机森林算法的总氮反演研究[J].环境科学与技术,2021,44(9):23-30.

[7]丁铭,李旭文,姜晟,等.基于无人机高光谱遥感在太湖蓝藻水华监测中的一次应用[J].环境监测管理与技术,2022,34(1):49-51.

[8]张兵,李俊生,申茜,等.长时序大范围内陆水体光学遥感研究进展[J].遥感学报,2021,25(1):37-52.

[9]王思梦,秦伯强.湖泊水质参数遥感监测研究进展[J].环境科学,2023,44(3):1228-1243.

[10]吴志杰,董世元,何炜琪,等.基于特征选择和机器学习的阳澄湖叶绿素a遥感反演研究[J].环境监测管理与技术,2022,34(1):27-32.

[11]黄昕晰,应晗婷,夏凯,等.基于无人机多光谱影像和OPT-MPP算法的水质参数反演[J].环境科学,2020,41(8):3591-3600.

[12]赵冉,杨凤芸,孟庆岩,等.GF-1与GF-6 WFV影像在滇池悬浮物浓度反演中的对比分析[J].光谱学与光谱分析,2023,43(1):198-205.

[17]李恩.基于无人机高光谱的氮磷含量反演方法研究[D].大连:大连海事大学,2020.

[18]章佩丽,宋亮楚,王昱,等.基于无人机多光谱的城市水体典型河道水质参数反演模型构建[J].环境污染与防治,2022,44(10):1351-1356.

[19]杨振,卢小平,武永斌,等.无人机高光谱遥感的水质参数反演与模型构建[J].测绘科学,2020,45(9):60-64.

[20]李爱民,许有成,王海隆,等.粒子群算法优化SVR的天德湖总氮遥感反演[J].环境监测管理与技术,2023,35(6):22-27.


基金资助:国家重点研发计划基金资助项目(No.2020YFC1807402); 南京市水务科技基金资助项目(202307);


文章来源:何炜琪,吴志杰,王紫安.基于无人机多光谱影像的城市河道水质反演[J].环境监测管理与技术,2024,36(05):51-55.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

环境监测管理与技术

期刊名称:环境监测管理与技术

期刊人气:1737

期刊详情

主管单位:江苏省环境保护厅

主办单位:环境监测中心,南京市环境监测中心站

出版地方:江苏

专业分类:环境

国际刊号:1006-2009

国内刊号:32-1418/X

邮发代号:28-341

创刊时间:1989年

发行周期:双月刊

期刊开本:大16开

见刊时间:一年半以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定