摘要:高光谱技术在反演土壤重金属含量方面具有独特优势,而高光谱中存在大量冗余信息,需要采用相应方法来减少冗余信息对反演精度的影响,以实现对土壤Zn含量的准确预测。以云南省墨江哈尼族自治县农田采集的土壤Zn含量与高光谱数据为数据源,将获取的高光谱数据利用Savitzky-Golay平滑处理后,使用R′、(1/R)′、(■)′、(logR)′四种不同数学形式的变换对光谱进行处理并构建了五种指数,即归一化指数(NDI)、差值指数(DI)、比值指数(RI)、和指数(SI)、倒数差值指数(IDI),从中挑选出与土壤Zn含量相关系数绝对值最大的光谱指数值作为模型输入量,结合偏最小二乘法(PLSR)与多元回归分析法(MLR)建立土壤Zn含量的最优反演模型,结果表明:(1)在不同数学变换形式下所得到的优化光谱指数值与土壤Zn含量均表现出较高的相关性,优化光谱指数能有效增强光谱与土壤Zn含量的敏感性,相关系数绝对值可达到0.7以上。(2)基于优化光谱指数得到的最佳预测模型(1/R)′~PLSR其验证集R2为0.77,RMSE为5.07mg·kg-1,RPD达到了2.09,较于相同变量的MLR模型R2提高了0.04,RMSE降低了0.47,RPD提高了0.18,具有较好的预测能力,可作为研究区土壤Zn含量的最优估测模型。(3)由最优估算模型结合空间插值方法,绘制出研究区土壤Zn含量空间分布图可知,土壤Zn含量的空间分布在图中部含量较高,且随着地形高程的增加而降低。基于优化光谱指数结合PLSR建模方法在估测土壤Zn含量方面具有一定的可行性,可为农田土壤Zn含量的估测提供参考。
土壤Zn是一种重要的土壤组成成分, 土壤中Zn的富集会导致其在植物和土壤生物体内积累从而影响土壤生态安全[1], 因此及时准确预测出土壤Zn含量的空间分布具有重要意义。 传统土壤重金属含量测量方法大多耗时长、 费用高, 甚至一些方法可能造成污染, 不适合进行大尺度预测[2]。 基于高光谱技术的分析过程中不会产生有害物质、 不损伤样本、 成本低, 可实现无损快速预测, 结合空间插值方法可为获得一定范围内的重金属空间分布情况提供可能。
通常在光谱中不可避免存在大量的噪声、无信息甚至是干扰的变量,严重影响模型的预测性能[3]。 同时当土壤重金属含量较低时, 会导致光谱响应十分微弱[4], 而消除噪声干扰、 提高光谱与土壤重金属的敏感性则需要对光谱进行不同的预处理或数学变换。 不同的预处理或数学变换会对模型的稳定性及可靠性有很大影响[5], 常用的光谱预处理与数学变换方法有对光谱进行导数变换、 标准正态变换、 多元散射校正、 包络线去除、 连续小波变换等, 利用有效的光谱预处理方法可突出光谱特征, 增强土壤重金属与光谱之间的相关性。 利用优化光谱指数具有放大波段间微弱联系, 降低模型复杂度等优势, 相对于筛选单变量特征波段作为模型输入量, 利用优化光谱指数能够很大程度上降低模型复杂度[6], 相比在选取单波段敏感波段时, 优化光谱指数更能挖掘两波段之间的隐藏信息, 增强土壤重金属与光谱之间的相关性。
目前基于高光谱的优化光谱指数方法已被大量应用于监测矿区重金属污染以及盐渍土相关的反演,周瑶等[7]利用不同光谱形式下优化光谱指数结合PLSR模型建立了多金属矿区砷的反演模型, 结果表明单变量特征波段结合优化光谱指数能提高模型预测精度。 亚森江·喀哈尔等[8]使用优化光谱指数结合地理加权回归模型预测露天煤矿砷的分布情况, 结果说明优化光谱指数方法应用于高光谱检测露天煤矿区土壤重金属砷含量具有一定的可行性。 张贤龙等[9]建立光谱变换结合高光谱指数对土壤盐分的反演模型, 结果表明相对于单一方法构建的模型, 光谱变换结合光谱指数的模型会更好。 前人用光谱数学变换结合优化光谱指数应用在许多方面并取得很好的效果, 但针对高光谱结合光谱指数监测农田土壤金属元素含量方面的研究仍较少。
本研究以云南省墨江哈尼族自治县农田土壤为研究对象,利用实测高光谱数据与土壤Zn含量实测数据, 基于四种不同形式数学变换对光谱进行处理, 通过两波段组合计算出五种优化光谱指数进一步提高土壤Zn与光谱之间的相关性, 并挑选出最佳组合波段结合PLSR和MLR构建土壤Zn含量预测模型, 基于最佳反演模型结合克里金插值方法绘制出研究区土壤Zn含量空间分布图, 为该地区土壤Zn含量分布估测提供参考。
1、实验部分
1.1 研究区概况
本研究区位于云南省普洱市墨江县农田区域,墨江县位于云南省南部地区,该地区雨水充沛,年平均降水量1 388 mm, 光照充足、 干湿季分明, 年平均气温17.8 ℃, 年平均蒸发量1 696.7 mm, 属于南亚热带半湿润山地季风气候。 海拔478.5~2 278 m, 属于低纬度高海拔地区。 矿产资源丰富, 河流交错、 多高山深谷、 地貌复杂, 土地多为酸性土壤, 农田以山地为主。
1.2 土壤样品采集
土壤采样时间为2022年2月中旬, 土壤样品采集以农田土壤为主, 采集深度为0~20 cm。 在采样过程中采用GPS定位采样点位置, 并对采样点周围环境进行记录, 包括采样点经纬度坐标、 周围植被类型等, 土壤进行自然风干研磨过筛, 将土壤样品分为两份, 一份进行土壤Zn含量的测定, 另外一份进行土壤高光谱反射率的测定。 将60个土壤原始光谱采用Kennard-Stone(KS)算法将样本按照2∶1划分为建模集和验证集, 最终选取40个样本作为训练集, 20个样本作为验证集。
1.3 光谱测定及预处理
土壤的光谱反射率测定使用ASD FieldSpec■3 型便携式地物光谱仪(350~2 500 nm), 为减少其他光源的影响, 在可控光照条件的暗室内进行土壤高光谱数据的测定, 将获取的高光谱数据利用Savitzky-Golay(SG)法对原始高光谱曲线进行平滑处理。 大量研究表明对光谱进行一阶导数变换能提高模型精度[10-12], 因此为减少噪声干扰, 更好的消除基线效应, 有效的突出光谱特征, 对平滑后的光谱曲线(R), 分别进行一阶导(R′)、 倒数的一阶导(1/R)′、 对数的一阶导(logR)′、 平方根的一阶导
四种不同数学变换。
1.4 优化光谱指数
二维光谱指数相对于一维光谱预处理的优势在于可以更充分地利用光谱数据中的信息,一维预处理只考虑了光谱数据中的一个维度,而五种优化光谱指数对350~2 500 nm波段范围内任意两波段进行两两组合, 顾及到了多个光谱维度之间的关系以及高光谱波段之间的相互影响, 可以进一步突显出波段之间的隐藏信息, 从而可以更全面地描述光谱特征, 并获取相关性更高的光谱特征波段, 基于五种光谱指数, 即归一化指数(NDI)、 差值指数(DI)、 比值指数RI、 和指数(SI)、 倒数差值指数(IDI)对四种数学变换下的光谱进行两两组合运算从而构建优化光谱指数, 光谱指数公式如表1。
表1 优化光谱指数及其公式
1.5 研究方法
1.5.1 反演模型
采用偏最小二乘(PLSR)与多元线性回归(MLR)模型作为土壤Zn含量的反演模型。 偏最小二乘法可以很好地解决多重共线问题, 处理变量数大于样本数的数据[13],PLSR在高光谱分析中得到广泛应用[14-15]。
多元线性回归模型(MLR)用于描述一个变量与多个变量的关系, 与简单线性回归模型不同, 多元回归模型把多个解释变量纳入模型, 可以同时考虑多个因素对因变量的影响, 从而避免重要因素被遗漏而导致构建的模型产生较大的误差。
1.5.2 精度评价
结合建模决定系数(R
校正均方根误差(RMSEC)、 预测均方根误差(RMSEP)、 相对分析误差(RPD)评价模型精度。 R2的计算结果越接近1, 表示模型能够较好地解释观测数据的变化, 拟合效果越好。RMSE表示模型预测值与实测值之间的差异, 用于衡量模型的预测精度。RMSE的计算结果越小, 表示模型的预测精度越高, 预测值与实测值的差异越小。RPD用来描述模型的预测性能, 当RPD≥2时, 表示模型的预测能力很好; 当1.4≤RPD<2时; 表示模型的预测能力一般。 当RPD<1.4时, 表示模型的预测能力较差, 则模型不能进行预测。
2、结果与讨论
2.1 优化光谱指数与土壤Zn含量相关性分析
不同数学变换形式下的光谱分别进行光谱指数运算,然后将计算得出的指数值与土壤Zn含量实测值进行相关系数的计算, 得到相关系数二维矩阵数据, 并绘制出土壤归一化指数(NDI)、 差值指数(DI)、 比值指数(RSI)、 和指数(SI)、 倒数差值指数(IDI)高光谱矩阵系数图, 如图1(a—t)所示。 通过比较矩阵系数图可知NDI与DI图以对角线为界上下两部分关系系数相反, 而SI与IDI图上下两部分关系系数相同, 既相互对称, 若二维相关性等势图上下|r|对称, 则最高|r|相同, 最佳波段组合相同。 而指数RI矩阵系数图上下部分|r|并不对称, 这是由不同指数的公式属性所导致, 基于指数DI与SI、 IDI所得到的较高相关系数数量显著多于指数NDI与RI, 说明相对于指数NDI与RI, 经过指数DI与SI、 IDI的计算更能突出更多与土壤Zn敏感状况相关的光谱有效信息, 能够较大程度提高与土壤Zn含量的相关性。
图1 不同形式光谱指数与土壤Zn含量的相关矩阵图
不同数学形式光谱变换下与土壤Zn含量的相关性, 选出最大相关系数绝对值波段组合, 如表2所示, 除了经过(1/R)′变换下的SI及IDI指数与Zn含量最大相关系数绝对值小于0.7以外, 其他最大相关系数绝对值均大于0.7, 光谱指数在经过不同的数学变换后均不同程度提高了与土壤Zn含量之间的相关性。 从指数层面看, 基于NDI指数在上述几种数学变换下最大相关系数绝对值均为0.756, 最优组合波段均为(2 284, 2 291), 同时NDI在上述几种数学变换下所得到的最大|r|均大于0.75, 表现较为突出。 指数DI、 SI及IDI在经过R′变换后均得到最大|r|, 分别为0.749、 0.730、 0.770, 最佳波段组合为(2 301, 2 283)、 (1 924, 2 168)、 (2 001, 683), 经过(1/R)′变换后计算得出的RI指数最高|r|为0.729, 对应的最佳波段组合为(2 268, 2 337)。 从数学变换形式方面看, 在经过R′变换后除指数RI外其他指数最高|r|均大于或等于其他数学变换形式所得出的最高|r|, 说明与其他三种数学变换相比R′可以进一步突显光谱隐含信息。 并且表2显示土壤Zn的各数学变换下的优化光谱指数最佳组合中的波段主要为1 908、 1 924、 2 168、 2 208、 2 268、 2 283、 2 284、 2 291、 2 301、 2 337, 所得到的波段基本在前人研究得到的范围内[16]。
表2 任意两波段光谱指数与土壤Zn含量相关系数最大值及最佳波段组合
2.2 土壤Zn含量估算模型构建
单变量特征波段在建模方面相对二维光谱指数所需要的光谱波段会更多,通常需要效果较好的特征选择算法来挑选建模所需要的光谱特征波段,增加了实验复杂性,而利用光谱指数来构建模型输入变量则可用最少的光谱波段得到最佳的反演模型。分别选择在R′、
不同数学变换下所构建的光谱指数与土壤Zn含量相关性绝对值最高的五个光谱指数值作为模型的输入变量。 采用PLSR和MLR进行建模, 结果见表3。 在同一数学变换形式下输入光谱指数值相同时PLSR所构建的模型精度要高于MLR, PLSR模型在处理多重相关性自变量, 能更好地进行敏感信息的筛选, 进而能提高模型预测精度。 以同一建模方法, 当输入变量为数学变换(1/R)′时所得的光谱指数值时, 模型精度高于R′、
=0.75和相对较低的RMSEC=6.68 mg·kg-1和RMSEP=6.05 mg·kg-1, 其预测性能较好(RPD值大于1.8), 但比(1/R)′~PLSR模型精度有所降低, 在多元回归模型方面基于MLR~(1/R)′的模型精度也较好(RPD值>1.8), 但相对于(1/R)′~PLSR与R′~PLSR模型RPD分别降低了0.18与0.07。 其他五种模型预测能力一般, RPD值均介于1.53~1.66之间, 模型对土壤Zn含量的估计有限。 (1/R)′~PLSR模型RPD>2.0说明模型预测能力很好, 因此在(1/R)′光谱变换下得到五种优化光谱指数相关系数绝对值最高, 五个光谱指数值结合PLSR能够获取光谱与土壤Zn含量之间更有效的信息并实现对土壤Zn含量的精准估算。
表3 土壤Zn含量估算模型精度结果对比
2.3 土壤Zn含量的检验结果
为了更加直观地对比PLSR和MLR模型, 基于PLSR与MLR的最佳土壤Zn含量实测值和预测值的散点图如图2(a, b)所示, 在1∶1散点图中, 样点越接近于1∶1线, 预测值就更接近于实测值, 模型预测的结果越精确。 通常模型实测值与预测值点大多集中于1∶1直线附近, 当验证集中有个别样点Zn含量较小时, 验证点则会偏离1∶1线, 随之模型精度会受到不同程度的影响。 相对于其他预测模型, (1/R)′~PLSR模型所得到的验证集拟回归直线与1∶1直线的夹角最小, 说明该模型的数据拟合能力相对于其他模型有一定程度的提高。
图2 基于PLSR与MLR的土壤Zn含量实测值和预测值的散点图
图3 土壤Zn含量的预测值空间分布图
图4 研究区高程
2.4 土壤Zn含量空间分布
采用2.2节选出的最佳土壤Zn含量预测模型所得到的预测值结合克里金插值法绘制土壤Zn含量空间分布图, 由图3可以看出, 预测结果图中部土壤Zn含量较高, 并呈现出由中间向四周逐渐降低的趋势。 由图中可知土壤Zn含量预测值在35.1~74.5 mg·kg-1, 此外研究区属于农田区域, 而云南省农田土壤Zn含量背景值为89.70 mg·kg-1[17], 可以看出土壤Zn含量在整个研究区内都没有超过背景值, 说明研究区农田并未被土壤重金属Zn污染。 图4为研究区高程图, 从东西两边看, 地势从中间向两边逐渐增高, 从北到南高程逐渐降低, 研究区中部有三处低洼地形。 土壤Zn在上游水流长时间的作用下发生移动, 并在低洼处沉积, 因此土壤Zn在研究区中部有三处地方Zn含量相对其他地方较高, 此外研究区为农田, 农药和化肥中有微量的Zn元素, 随着农业的发展农药和化肥的使用也是造成土壤Zn含量研究区中部土壤Zn含量较高的原因之一。
3、结论
(1)在四种数学变换下的优化光谱指数均能与土壤Zn含量呈现出很高的相关性, 并在很大程度上减少高光谱冗余信息, 放大微小信息, 更为精确挑选出包含有效信息的波段。 对提高模型精度有很大影响。 在R′数学变换下的指数IDI, 关系系数绝对值最高达到0.77。
(2)对土壤Zn含量优化光谱指数进行PLSR与MLR建模发现, PLSR拟合模型精度优于MLR模型, 其中以采用(1/R)′数学变换形式下所得到的五种优化光谱指数的最佳组合波段为模型输入量的PLSR模型为最佳, 估算精度为R
为0.77, RMSEP为5.07 mg·kg-1, RPD为2.09。
基于最佳模型(1/R)′~PLSR结合克里金插值方法所绘制的研究区土壤Zn含量分布图显示, 在分布图中部土壤Zn含量达到最高并有向四周逐渐降低的趋势, 表明在研究区中部土壤Zn有一定的沉积, 含量较高, 但研究区农田并未受到重金属Zn污染。
基金资助:国家自然科学基金项目(42067029); 云南省科技厅项目(202205AC160005)资助;
文章来源:李智缘,田安红.基于光谱指数的土壤重金属Zn的定量预测与空间分布研究[J].光谱学与光谱分析,2024,44(11):3287-3293.
分享:
塑料是一种人工合成的有机高分子材料,具有化学性质稳定、制备成本低廉等特点,被广泛应用于日常生活和工业生产中。统计表明,每年有470万吨~1280万吨塑料垃圾随地表径流汇入海洋环境[1]。目前海洋中漂浮的塑料碎片数量已超过5万亿个,无疑给海洋环境造成了极大压力,随之而来的污染问题也越来越受关注[2]。
2024-11-2020世纪30年代,PFAS被合成出来[2]。因其具有良好的热稳定性、化学稳定性以及既能疏水又能疏油的双重特性,被广泛应用于纺织、皮革、半导体、金属电镀、消防、包装、照相以及印刷等与人类日常生活密切相关的行业,被称为“工业味精”[3]。
2024-11-20新污染物一般指新近被发现或被关注、对生态环境或人体健康存在风险、尚未纳入管理或者现有管理措施不足以有效防控其风险的污染物,如持久性有机污染物、环境激素、抗生素与微塑料等。这类污染物具有严重危害性、来源广泛性、风险隐蔽性、环境持久性及治理复杂性等特点[1-2]。
2024-11-19双酚类化合物(bisphenol analogues,BPs)是一种常见的内分泌干扰物,主要用于生产聚碳酸酯和环氧树脂等聚合材料,被广泛应用于塑料、纸币和热敏纸等日常用品中[1]。其中,双酚A(bisphenol A,BPA)是最典型且应用最广的BPs,作为全球使用最广泛的工业化合物之一,其年产能高达约750万吨[2]。
2024-11-19生态系统作为全球碳循环的重要组成部分[1],其碳汇能力对维护全球碳平衡和气候稳定起着决定性作用[2]。在此背景下,净生态系统生产力(NEP)被广泛接受为衡量生态系统碳源或碳汇能力的重要指标[3],其研究对于全球碳循环的理解和应对全球气候变化具有深远影响。
2024-11-19福建茶区以其独特生态及丰富生物多样性,跻身全球关键茶叶产区之列,对全球生态保护及茶产业可持续发展具有举足轻重的影响。该区生物多样性不仅赋予茶树得天独厚的生长条件,更在调节生态平衡、维系生态系统稳定及提升茶叶品质等层面扮演至关重要的角色。
2024-11-19在“十四五”规划的宏伟蓝图中,我国对生态文明建设提出了更高的要求,特别强调了土壤、地下水和农村生态环境的保护与治理;2024年中央一号文件进一步突出了土壤保护和治理的重要性,认为这不仅是农业生产可持续发展的关键,也是乡村振兴战略的基石。
2024-11-19高氯酸盐因其来源广泛、不易降解、在水中的高溶解度以及强迁移能力,普遍存在于水体、土壤等环境介质中[1-2]。它们可能导致灌溉水和饮用水中的高氯酸盐污染,进而通过食物链进入人体[3-4]。高氯酸盐的应用领域广泛,包括作为航天火箭燃料、烟花爆竹中的氧化剂、汽车安全气囊的填充物等。
2024-11-19准确掌握污水处理厂的碳排放特征及其影响因素,对于统筹污水处理行业碳排放及污水处理厂低碳运营管理具有重要意义。本研究基于污水处理碳排放体系,对粤西某大型污水处理厂的碳排放特征进行研究,以期为广大污水处理厂运营管理从业人员提供借鉴。
2024-11-17随着工业化和城镇化进程的快速推进,产业园区建设日益受到重视。产业园区是承载区域主导产业的各类工业园区、集聚区和价值园区的总称,也是环境污染集聚的区域和环境风险事件高发的区域。不少产业园区在规划建设过程中存在定位不清、同质化竞争、环境保护投入不足等问题,导致园区环境污染负荷过重,生态环境风险突出。
2024-11-14我要评论
期刊名称:环境科学与技术
期刊人气:2825
主管单位:湖北省生态环境厅
主办单位:湖北省环境科学研究院
出版地方:湖北
专业分类:工业
国际刊号:1003-6504
国内刊号:42-1245/X
邮发代号:38-86
创刊时间:1978年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:1.587
影响因子:0.566
影响因子:1.350
影响因子:0.000
影响因子:0.932
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!