CHINESEJOURNALOFLUMINESCENCE
发 光 学 报
Vol40
Dec.ꎬ2019
No12
文章编号:1000 ̄7032(2019)12 ̄1563 ̄11
基于熵值组合模型的矿业复垦土壤重金属高光谱反演
(1.安徽理工大学测绘学院ꎬ安徽淮南 232001ꎻ 2.安徽理工大学地球与环境学院ꎬ安徽淮南 232001)
夏 可1ꎬ张世文2∗ꎬ沈 强1ꎬ杨邵文1ꎬ夏沙沙2ꎬ胡青青2
摘要:探讨组合模型在土壤重金属含量高光谱估算中的可行性ꎬ以四川古蔺工矿废弃地复垦土壤为研究对
象ꎬ采集样品并测得重金属含量(Cd、Cr、Ni、As和Hg)和光谱信息ꎻ对土壤光谱进行预处理ꎬ探索响应波段ꎻ利用PLS、ANN和RF构建单一估测模型ꎻ利用熵值法进行较优模型组合ꎮ结果表明ꎬ4种光谱预处理技术对光谱与重金属含量之间的相关性均有不同程度的提升ꎻ单一预测模型MSC ̄RF模型效果最优ꎬ可最大程度对重0.91ꎻ表明组合模型能够较大限度利用多种单个模型的样本信息ꎬ减少单个模型中随机因素的影响ꎬ增强模型的稳定性ꎬ对矿业废弃地复垦土壤重金属含量的预测具有更好的发挥作用ꎮ关 键 词:矿业废弃地ꎻ土壤重金属ꎻ高光谱ꎻ熵值法ꎻ组合模型
中图分类号:TP79 文献标识码:A DOI:10.3788/fgxb20194012.1563
金属含量进行预测ꎻ通过熵值法构建的组合预测模型较单一预测模型效果有所提升ꎬ验证集R2最高达到
HeavyMetalHyperspectralInversioninMiningReclamation
SoilBasedonEntropyValueCombinationModel
XIAKe1ꎬZHANGShi ̄wen2∗ꎬSHENQiang1ꎬYANGShao ̄wen1ꎬXIASha ̄sha2ꎬHUQing ̄qing2
(1.SchoolofGeodesyandGeomaticsꎬAnhuiUniversityofScienceandTechnologyꎬHuainan232001ꎬChinaꎻ2.SchoolofEarthandEnvironmentꎬAnhuiUniversityofScienceandTechnologyꎬHuainan232001ꎬChina)
∗CorrespondingAuthorꎬE ̄mail:mamin1190@126.com
Abstract:Thispaperwasaimingtoexplorethefeasibilityofthecombinedmodelofhyperspectraonsoilheavymetalcontent.TakingthereclaimedsoilinGulinꎬSichuanProvinceastheresearchob ̄jectꎬthesampleswerecollectedandthecontentsofheavymetals(CdꎬCrꎬNiꎬAsandHg)andspectralinformationweremeasured.Thesoilspectrumwaspreprocessedtoexploretheresponseusedforbettermodelcombination.Theresultsshowedthatthecorrelationbetweenheavymetalcon ̄tentandspectrumwasimprovedbyfourkindsofspectralpretreatmenttechniques.Thesinglepre ̄bandꎻPLSꎬANNandRFwereusedtoconstructasingleestimationmodelꎬandentropymethodwasdictionmodelMSC ̄RFhadthebesteffectandcouldpredicttheheavymetalcontenttothemaximumextent.Comparedwiththesinglepredictionmodelꎬthecombinedpredictionmodelconstructedby0.91.Itwasshowedthatthecombinedmodelcouldmakeuseofsampleinformationofmultiplesin ̄stabilityofthemodelꎬandplayabetterroleinthepredictionofheavymetalcontentofsoilinaban ̄donedminingland.
glemodelstoalargeextentꎬreducetheinfluenceofrandomfactorsinasinglemodelꎬenhancethetheentropyvaluemethodhasanimprovedeffectꎬandtheverificationsetR2reachesamaximumof
收稿日期:2019 ̄07 ̄09ꎻ修订日期:2019 ̄08 ̄17
基金项目:国家重点研发计划(2017YFF0206802ꎬ2016YFD0300801)ꎻ陕西省土地整治中心重点实验室开放基金(2018 ̄ZD07)资助项目
SupportedbyNationalKeyResearchandDevelopmentProgram(2017YFF0206802ꎬ2016YFD0300801)ꎻOpenFundforKeyLa ̄boratoryofShaanxiLandImprovementCenter(2018 ̄ZD07)
1564发 光 学 报第40卷
Keywords:miningwastelandsꎻsoilheavymetalsꎻhyperspectralꎻentropymethodꎻcombinationmodel
1 引 言
中国作为世界人口大国之一ꎬ同时也是一个能源消耗大国ꎮ据相关资料显示ꎬ目前我国矿山约有103187个ꎬ大中型矿山9399个ꎬ小型矿山和个体矿93788个ꎮ我国矿产资源丰富ꎬ许多矿山已有近百年的开采历史ꎬ为我国的经济建设和地区发展做出了极大的贡献ꎬ与此同时ꎬ随着矿产资源的开采ꎬ对矿山周边的环境造成了严重的污染和破坏ꎮ**总在党的十九大报告中指出ꎬ坚持人与自然和谐共生ꎬ树立金山银山就是绿水青山的理念ꎬ因此矿山生态修复以及土地复垦显得愈发重要ꎮ截至
2017hm2ꎬ治理下的矿山约年底ꎬ我国新增矿10山032恢复个面[1]积约4.43万土地复垦与生态修复是治理矿山的有力手ꎮ
段ꎬ矿区土地与环境监测则是土地复垦与生态修复的前提和基本要求ꎮ在矿山开采过程中造成的矿业废弃地污染以重金属为主ꎬ重金属污染对人体造成的危害巨大ꎬ因此土地复垦中对重金属的检测尤为重要ꎮ重金属检测可以为土地复垦提供方案选择、复垦效果评价ꎬ实现长期动态监测ꎮ传统的重金属检测以实验室测定为主ꎬ例如原子荧光法(AFS)、电感耦合等离子体法(ICP)、电感耦合等离子质谱法(ICP ̄MS)、原子吸收法(AAS)等ꎬ其效率低、成本高ꎬ无法实现大面积检测ꎬ且长期动态监测比较困难ꎮ近年来ꎬ高光谱遥感技术以其独特的优势ꎬ在很多领域研究中得到了良好的发展与应用ꎬ这也为土壤重金属检测提供了一个全新的途径ꎮ国内外众多专家与学者利用高光谱遥感对土壤中各成分都进行过大量的研究ꎬ王维等发现一阶微分高光谱反演模型对土壤重金属Cu具有较好的估算潜力[2]归模型对印度旁遮普印度恒河平原的土壤有机ꎻSrivastava等利用偏最小二乘回碳含量进行了快速的预测[3]同光谱分辨率下的光谱特征ꎻBabaeian提取土壤等利用不水力参数ꎬ并用HYPRES和Rosettapedotransfer函数进行评价ꎬ结果表明估计的性能取决于水力参数的类型以及输入信号的频谱分辨率[4]通过一阶微分、倒数对数、连续统去除法结合多
ꎻ沈强等元逐步回归模型Asꎬ发现矿业废弃地重构土壤中型[5]的最佳反演模型为连续统去除法逐步回归模校正预处理ꎻ李晋华等通过多光谱数据进行多元散射ꎬ并结合偏最小二乘模型对玉米成分进行预测ꎬ取得了较好的效果[6]用光谱数据对水稻冠层氮素含量ꎻ建李旭青等利立反演模型ꎬ结果表明随机森林算法可有效地对水稻冠层氮素含量进行解释、且所需样本少、不易拟合[7]前人在土壤成分含量估测方面做了大量的研
ꎮ
究并取得了较好的结果ꎬ但多集中在单一预测模型ꎬ单一预测模型往往不能全面反映事物的信息ꎬ信息的缺失又将会导致预测的偏差[8]减弱单一预测模型中随机因素的影响ꎬꎬ因此为了提高模型预测精度ꎬ本文以四川省古蔺县石屏硫厂废弃地复垦土壤为研究对象ꎬ基于Matlab和Python编程平台以多种光谱数据预处理结合线性模型与非线性模型进行对比ꎬ在此基础上寻求较优单一模型ꎬ探讨较优模型组合方式在土壤重金属含量高光谱估算中应用的可行性ꎬ以期为基于高光谱遥感技术下的矿业废弃地复垦土壤重金属快速检测提供理论和方法支持ꎮ
2 2.1 实研究区概况
验
研究区位于四川省古蔺县石屏乡(东经105°59′54″~
106°01′57″ꎬ四川盆地与贵州高原的过渡地带北纬28°01′3″~28°02′51″ꎬ具有四川盆地之间)ꎬ地处气候和高原气候特征ꎬ四季分明、雨热同期ꎬ年降水量偏少ꎬ温度适中ꎬ光照条件较充足ꎬ年平均气温在13.8~18.6℃之间ꎮ研究区总面积约为
4磺开采和冶炼451.89亩ꎬ从上世纪ꎬ随着时间的推移50年代始建ꎬ矿区废弃物堆积ꎬ主要从事硫如山ꎬ对周边土壤和环境造成严重破坏ꎮ研究区于2013年进行复垦ꎬ复垦方向主要为林地、耕地和草地ꎬ复垦措施主要为覆土、平整和土壤改良ꎬ并于2014年底完成复垦ꎮ2.2 数据获取
数据主要来源于实验室测定和光谱测量ꎮ在研究区内采用网格随机布点ꎬ共采集65个土壤样本ꎬ土壤采样深度为0~20cmꎬ主要涉及的复垦 第12期夏 可ꎬ等:基于熵值组合模型的矿业复垦土壤重金属高光谱反演 1565
地块类型有矿渣堆、旱地、林地、水田ꎮ将采集的土样经自然风干、研磨、过100目筛ꎬ各取100gꎬ分成两份ꎬ一份用于实验室测定土壤重金属含量ꎬ一份用于光谱测量ꎮ实验室土壤重金属的测定采用电感耦合等离子法(AnalyticalSpectralDevices)ꎬ光谱数据利用美国公司生产的Fieldspec
ASD4选择光线较暗的实验室便携式地物光谱仪测定ꎬ提前预热机器ꎮ在进行光谱测量时10minꎬ调ꎬ整好探头与光源位置ꎬ将样本放在培养皿中ꎬ下面用黑布平铺ꎬ实验之前进行白板校正ꎬ实验过程中10每10个样本进行一次白板校正ꎮ每个样本测定RS3次ꎬ取其平均值作为最终的光谱数据ꎬ利用行数据后处理软件进行光谱数据收集ꎮ利用K ̄S(Kennard ̄Stone)ꎬViewSpecPro软件进算法划分建模样本和验证样本ꎬK ̄S算法能够根据光谱变量间的欧式距离ꎬ在特征空间中均匀地选取光谱差异较大的样本[9]离和含量选样更为合理ꎬ较传统随机选样或根据距ꎮ
2.3 数据预处理光谱测量过程中由于仪器的原因、人为因素的影响以及外界环境的干扰都会对光谱数据造成影响ꎮ而这些噪声对特征波段的选取和模型的建立都会造成影响S ̄Gꎬ为此我们首先对光谱数据进行
一阶平滑处理以减弱噪声[10]
(1))、微DSꎬ离差标分[11](ꎬ其次再对数据进行准FirstorderdifferentialꎬFDRꎬ公式scatter公式(2))、多元散射校正化[12](Deviation[13 ̄14]standardizationꎬ去除法correctionꎬMSCꎬ[15 ̄16]公式(3)~(5))(Multiplicative和连续统变换ꎮ
(ContinuumremovalꎬCR)等预处理R′=
[R(λi+1)-R(λi-1)]
R(λ2Δλ
ꎬ
(1)R(λi)∗=R(λimax))--RR((λλmaxmin)
)ꎬ
(2)
其中ꎬλi为第i个光谱波长ꎬR(λi长的反射率ꎬΔλ为λ)为对应光谱波R(λi+1与λi之间的差值ꎬ
和最小反射率max)、R(λminꎮ
)分别为某一样本的最大反射率n
Aiꎬj=
∑i=1
Aiꎬj
n
ꎬ(3)Ai=mi(AA+biꎬ(4)Ai(MSC)=
im-bii
)
ꎬ(5)
其中ꎬA表示光谱矩阵ꎬn为样本数ꎬAi为平均光谱ꎬmi和bi分别为样品光谱Ai与平均光谱A进行一元线性回归得到的相对偏移系数和偏移量ꎮ
2.4 建模方法
2.4.1 偏最小二乘偏最小二乘
(PartialleastsquaresꎬPLS)的基
本原理是通过最小误差的平方和找寻一组数据的最佳匹配函数ꎬ它是传统的多元线性回归、典型相关分析和主成分分析的集合体[17 ̄18]元线性回归而言ꎬ偏最小二乘能够允许自变量直ꎮ较传统多接存在多重相关性ꎬ可以在样点个数低于变量个数的情况下实行建模ꎮ建模原理为:建立m×n的光谱矩阵Xꎬn×l的重金属含量检测矩阵Yꎬ其中m为光谱波段数ꎬn为样品个数ꎬl为重金属种类ꎮ
将X、Y进行分解ꎬ公式如下:
X=TPTY=UQT+Eꎬ
(6)+Fꎬ(7)
其中PLSRꎬU、T为得分矩阵ꎬP、Q为载荷ꎬE、F为为关联系数矩阵模拟时的残差矩阵ꎬ有U=ꎮTB对ꎬ重金属含量预测公
U、T做线性回归ꎬB式为:
2.4.2 Y预测=T计算BQ=X测量PTBQ.
(8)
人工人工神经网络
ANN)是一种仿生物神经网络技术神经网络(Artificialneural主要分为输入层、隐藏层和输出层ꎬ由大量神经networkꎬ
元连接而成ꎬꎮ
人工神经网络具有自适应和自主学习的能力ꎬ因而在处理大量随机性数据和非线性数据方面具有2.明显优势[19]4.3 随机森林ꎮ
Breiman随机森林(RandomforestꎬRF)算法最早由Leo
且不易产生过拟合和AdeleCutlerꎬ对于大数据而言所提出ꎬ能够处理高维特征ꎬ模型训练速度较快ꎬ对数据的适用能力较强[20 ̄21]训练样本个数为Mꎬ特征数目为Nꎬꎮ从基本原理为M个训练集中:设以bootstrap取样方式取样M次ꎬ对未抽取样本进行预测和评估误差ꎬ针对每一节点随机选取n个特征ꎬ根据这n个特征选择最佳方式ꎬ其次在每个训练子集上构建决策树ꎬ最后根据每棵决策树的输出取平均或投票作为最终结果ꎮ
2.5 熵值权系数组合模型组合模型是将多个模型综合在一起ꎬ赋予不
1566发 光 学 报第40卷
同的权重进而得到预测模型ꎮ组合模型预测的核心就是如何确定模型的权重ꎬ由于预测模型中预测值与实测值之间的残差具有不确定因素ꎬ而熵值法在组合模型中有较好的适用性[22]ꎮ其计算公式为:
(xt-xit)ìï1ꎬ≥1ꎻ
xtï
eit=í
ï(xt-xit)(xt-xit)ïꎬ0≤îxtxt
pit=
eit
ꎬ
3 结果与讨论
3.1 数据预处理结果
原始光谱数据受到噪声、样本背景和其他无关成分等干扰ꎬ选用合适的预处理方法能够消除噪声ꎬ提升模型预测能力ꎮ因此在建立重金属定量反演模型中ꎬ光谱数据预处理十分重要ꎮ对原2500nmꎬ由于光谱在采样过程中光谱波段两端2451~2500nm范围内的波段数据ꎬ共采集2000果ꎬ依次为FDR、DS、MSC和CRꎮ
产生较大的噪声ꎬ为此ꎬ剔除了350~449nm和组波段数据ꎬ如图1所示ꎮ图2为不同预处理结
0.8
0.70.6Reflectance0.50.40.30.20.10450
≤1
ꎬ
始光谱进行S ̄G平滑处理ꎬ光谱波段范围为350~
hi=-k∑pitlnpitꎬ1æ1-çli=çm-1
è
di=1-hiꎬ
t=1
eit∑t=1
n
n
(10)(11)(12)(13)
(9)
其中ꎬxt与xit分别为建模集第t个样本的实测值和第i种模型对应的预测值ꎻeit为归一化序列ꎻ在第i种模型中ꎬpit为第t个样本预测值与实测值相对误差的比重ꎻhi为相对误差的熵值ꎻdi为变异程度系数ꎻli为各种模型的加权系数ꎬ且∑li=1ꎮ
i=1m
diö
÷m
÷ꎬ∑diø
i=1
7501050135016501950
姿/nm
2250
图1 土壤原始光谱反射率曲线Fig.1 Originalspectralreflectancecurveofsoil
6E鄄035E鄄03Reflectance4E鄄033E鄄032E鄄031E鄄03
(b)
0.008
(a)
0.0060.0040.002
0
Reflectance-0.002-0.004-0.006-0.008
450
7501050135016501950
姿/nm
2250
0E鄄03
4501.0101.0000.990Reflectance0.9800.9700.9600.950
7501050135016501950
姿/nm
(d)
2250
Reflectance0.500
()
0.450c0.4000.3500.3000.2500.2000.1500.1000.050
0450
7501050135016501950
姿/nm
2250
0.940
450
7501050135016501950
姿/nm
2250
图2 不同预处理光谱反射曲线
Fig.2 Spectralreflectioncurvesofdifferentpretreatments
第12期夏 可ꎬ等:基于熵值组合模型的矿业复垦土壤重金属高光谱反演 1567
3.2 土壤重金属含量分析
为了获悉pH和不同重金属含量之间的差异ꎬ利用SPSS软件做描述性统计ꎬ如表1所示ꎮ8.28之间ꎬ均值为6.38ꎬ土壤呈酸性居多ꎬ较少部
由表1可知ꎬ研究区的pH范围在2.90~
量偏低ꎬCr和Ni的含量较高ꎻ从标准差来看ꎬCr的离散程度最大ꎬHg的离散程度最小ꎻ从变异系数来看ꎬ5种重金属变异系数均在30%以上ꎬ其中Cd的变异系数最大ꎬ达到114.44%ꎬ这可能是由于先前的采矿活动对周边环境影响较大ꎬ导致不确定因素增加ꎬ引起Cd分布发生异变ꎻ土壤中过量的Cd会抑制植物的生长ꎬ亦能通过食物链严重危害人体的健康ꎬ因此Cd异变应引起注意ꎮ
分为弱碱性ꎬ主要是由于该研究区长期进行采矿活动所导致ꎮ从含量统计分析表中可以看出ꎬ5种重金属之间的含量差异比较明显ꎬ其中Cd和Hg的含
表1 土壤重金属含量统计分析
Statistics
Tab.1 Statisticalanalysisofheavymetalcontentinsoil
8.282.906.3820.691.32
Max/(mgkg-1)Min/(mgkg-1)
pH
5.740.060.90114.441.03
Cd
310.40151.0446.9531.0882.80
Cr
131.0014.9063.9421.8434.16
Ni
27.7512.6649.136.222.66
As
0.570.040.1952.630.10
Hg
Mean/(mgkg-1)
Standarddeviation/(mgkg-1)Variablecoefficient/%
3.3 相关性分析
重金属在不同的波段对光谱的吸收强度也不同ꎬ因此不同波段所显示的相关性也不同ꎮ将经预处理后的光谱数据与土壤重金属含量做相关性
0.8
(a)0.60.40.20-0.2-0.4-0.6-0.8450CdCrNiAsHg
分析ꎬ找寻显著相关的波段ꎬ以期为后期建模打下基础ꎮ相关性大小用皮尔森系数R表示ꎬ图3分别为一阶微分(a)、离差标准化(b)、多元散射校正(c)和连续统去除法(d)的相关系数曲线图ꎮ
0.4(b)0.30.20.10-0.1-0.2-0.3-0.4-0.5-0.50CdCrNiAsHg
Correlationcoefficient8501250165020502450Correlationcoefficient8501250165020502450姿/nm
0.80.60.40.20-0.2-0.4-0.6-0.8450
(c)
姿/nm
0.6(d)0.40.20-0.2-0.4-0.6-0.8450
850
1250
1650
2050
2450
Cd
Cr
Ni
As
Hg
CdCrNiAsHg
CorrelationcoefficientCorrelationcoefficient8501250165020502450
姿/nm姿/nm
图3 土壤重金属含量与不同变换形式下光谱反射率的相关系数
Fig.3 Correlationcoefficientofspectralreflectanceonheavymetalcontentinsoilunderdifferenttransformationforms
从图3中可以看出ꎬ经不同的预处理ꎬ不同重金属相关性幅度变化较大ꎬ但都有不同程度的提升ꎮ经一阶微分变换ꎬCd、Cr、Ni、As、Hg相关性较
原始光谱相关性均有所提高ꎬ对Cd和Cr相关性提高最为明显ꎬ在1910ꎬ2206nm处绝对值分别达到0.475和0.532ꎬHg相关性在1910nm处达
1568发 光 学 报第40卷
到极大值ꎬ为-0.706ꎻ5种重金属与光谱曲线的相关性系数基本都低于0.6ꎬ但大部分波段达到了水平为0.05以上的显著相关ꎬ部分波段达到水平为0.01以上的极显著相关ꎮ经离差标准化变换ꎬ5种重金属相关系数没有一阶微分提升明显ꎬ但多种重金属相关性整体提高ꎬ以Cr和Ni最为明显ꎬCr波段相关性绝对值整体位于0.4以上ꎬNi为0.3以上ꎻ对于Cd、As和Hg而言效果不为明显ꎬ其中Cd效果最不理想ꎮ经连续统去除法2212ꎬ1418ꎬ1415nm处达到极值ꎬ分别为关性虽说有所提升ꎬ但并不是最佳ꎮ经多元散射校正变换后ꎬNi和As相关性极好ꎬ相关系数分别0.715ꎬ整体波段也表现较高的相关性ꎻHg相关性在1600nm处达到极大值0.636ꎬ未有一阶微分达到的极大值高ꎬ但整体波段达到了很好的相关性ꎬ有一半波段相关性绝对值位于0.5以上ꎻCd在1279nm处达到极大值0.498ꎬ较比其他3种在1929nm和568nm处达到极值ꎬ为-0.679和-0.398ꎬ-0.484ꎬ-0.481ꎬ-0.57ꎬ-0.513ꎬ相变换后ꎬCd、Cr、Ni、As和Hg在1394ꎬ2208ꎬ
预处理ꎬ多元散射校正效果达到最佳ꎻCr在2316
nm处达到极值-0.423ꎬ提升效果不为明显ꎮ总体来说ꎬ经多元散射校正变换后ꎬ多种重金属达到极高的相关性ꎬ表明多元散射校正能够有效去除噪声以及由散射带来的基线漂移等干扰ꎬ增强与3.4 单一模型建立与分析样品成品相关的光谱信息[23]ꎮ
(建模样本50个ꎬ验证样本15个)ꎬ对样本进行交叉验证ꎮ通过对光谱数据不同的预处理做相关性分析ꎬ选择相关性较大和显著性波段分别用于PLS、ANN和RF模型的建模ꎮ采用决定系数(DeterminationcoefficientꎬR2)、均方根误差(RootmeansquareerrorꎬRMSE)和相对分析误差(Rela ̄tivepercentdeviationꎬRPD)指标对模型进行精度评定ꎮ其中决定系数作为数据拟合程度的一个评定ꎬ越接近于1ꎬ效果越好ꎻ均方根误差反映预测数据的精密度ꎬ用来衡量预测值与真值之间的偏差ꎬRMSE越小表明预测精度越高ꎻ相对分析误差指预测偏差ꎬ它是标准差与均方根误差的比值ꎬ
利用K ̄S算法将样本划分为建模集和验证集
表2 偏最小二乘模型(PLS)Tab.2 Partialleastsquaresmodel(PLS)
Element
Pretreatment
FDR
Cd
MSCFDR
Cr
MSCFDR
Ni
MSCFDR
As
MSCFDR
Hg
MSCCRDSCRDSCRDSCRDSCRDS
R2
Modelingset
0.470.520.580.500.740.830.720.700.620.860.830.750.830.650.870.790.790.830.800.82
RMSE
0.720.680.6117.7314.4518.8619.6610.135.986.309.191.893.341.812.310.040.030.040.040.71
0.350.480.550.400.690.790.690.660.450.750.760.680.800.590.820.740.740.780.740.76
R2
ValidationsetRMSE
0.910.700.7620.8716.9620.1521.3011.316.376.881.793.922.493.030.040.040.040.040.97
RPD
0.421.150.691.062.272.001.740.941.982.092.612.061.292.141.901.892.151.802.241.9
10.76
第12期夏 可ꎬ等:基于熵值组合模型的矿业复垦土壤重金属高光谱反演
表3 人工神经网络模型(ANN)Tab.3 Artificialneuralnetworkmodel(ANN)
Modelingset
ValidationsetRMSE
0.370.710.1717.8415.6622.0421.4112.855.268.348.032.422.953.463.160.040.030.040.060.66
1569
ElementPretreatment
FDRDS
R2
0.710.440.860.590.810.880.770.740.670.870.790.800.850.810.800.780.730.850.790.62
RMSE
0.330.700.1615.5411.7717.4818.4710.424.968.077.881.732.162.042.140.040.030.040.050.61
0.680.310.790.540.760.830.660.690.590.820.740.750.790.700.750.730.670.820.770.41
R2RPD
1.320.351.721.112.122.191.711.951.341.721.952.060.951.491.311.841.852.441.502.8
Cd
MSCFDRCRDS
Cr
MSCFDRCRDS
Ni
MSCFDRCRDS
As
MSCFDRCRDS
Hg
MSCCR
表4 随机森林模型(RF)Tab.4 Randomforestmodel(RF)
Element
Pretreatment
FDR
Cd
MSCFDR
Cr
MSCFDR
Ni
MSCFDR
As
MSCFDR
Hg
MSCCRDSCRDSCRDSCRDSCRDS
R2
Modelingset
0.790.720.860.430.760.800.780.740.740.660.860.420.900.610.910.670.890.750.880.67
RMSE
0.210.280.1523.1617.8418.8824.3210.7116.851.683.591.443.160.020.040.020.054.478.770.63
0.700.630.830.220.740.760.740.730.670.560.830.340.860.500.890.600.850.680.840.58
R2
ValidationsetRMSE
0.250.360.1818.8518.6119.0320.3310.5613.3218.471.792.004.040.030.040.030.053.94.780.93
RPD
1.011.321.760.221.451.381.131.351.090.732.720.382.270.832.770.652.301.202.520.80
1570发 光 学 报第40卷
RPD的高低反映模型的预测能力ꎬ当RPD>2.0
时ꎬ模型的预测能力很好ꎬ当2.0>RPD>1.5时ꎬ模型的预测能力一般ꎬ当RPD<1.5时ꎬ表明建模失败[24]ꎮ表2~表4依次为PLR、ANN和RF建模结果ꎮ
种建模方法来说差异较大ꎬ从验证集的R2、RMSE
从表2~表4中可以看出ꎬ不同的预处理对3
RPD有明显提升ꎬ其中As效果最好ꎬR2、RMSE和RPD分别达到0.89ꎬ2.00ꎬ2.77ꎬ其次是Hg、Ni和CdꎬR2均达到0.80以上ꎬCr较比其他3种预处理变换效果无明显差异ꎮ
根据以上分析可知ꎬ结合MSC和RF的优势ꎬ相比其他预处理ꎬMSC ̄RF模型整体来说要略胜一筹ꎬ其次DS ̄ANN对重金属含量相对偏高的元素也表现出了较好的预测能力ꎮ总体来说ꎬ采用多元散射校正结合随机森林建立的重金属反演模型效果最好ꎮ
3.5 组合模型与验证结果
型能够“取长补短”ꎬ发挥多种模型的优势[25]ꎻ组合模型的关键问题在于单一预测模型的选取以及相应权重系数的确定ꎬ本文针对不同重金属ꎬ分别选取两种较优单一模型ꎬ利用熵值法确定模型权重系数ꎬ结果如表5和图4所示ꎮ
单一模型自身存在一定的局限性ꎬ而组合模
和RPD来看ꎬ多元散射校正结合随机森林建模ꎬR2与RPD普遍达到了0.80和2.0以上ꎮ偏最小二乘模型预测效果一般ꎬ其中As经多元散射校正变换后效果最好ꎬR2与RPD分别为0.82和2.14ꎮ离差标准化结合神经网络对于含量相对较高的Cr、Ni预测效果较好ꎬR2和RPD最高达到0.83和2.8ꎬ表明在进行重金属高光谱含量估算中需要考虑重金属含量对建模反演效果的影响ꎮ较比前两种建模方式ꎬ随机森林表现了优异的估测能力ꎬ经多元散射校正变换多种重金属的R2和
表5 组合模型参数
Element
CdCrNi
Y=0.511×RFMSC+0.489×ANNMSCY=0.506×ANNDS+0.494×RFMSCY=0.502×RFMSC+0.498×RFFDR
Combinationmodel
Tab.5 Combinedmodelparameters
0.850.860.870.910.89
R2RMSE
14.165.091.850.16
RPD
2.392.572.612.622.96
Y=0.501×ANNDS+0.499×PLSRDSY=0.534×RFMSC+0.466×PLSRFDR
Notes:YrepresentativepredictivevalueꎬCapitallettersrepresentmodelsꎬThesubscriptrepresentsthepreprocessingtransformation.
·Predictedvalue/(mgkg-1)Hg
As
0.025
2.52.01.51.00.500
·Predictedvalue/(mgkg-1)Cd
3002401801206000
Cr
MSC鄄RF
MSC鄄ANN
组合模型
线性(组合模型)
DS鄄ANNDS鄄PLSR
组合模型
线性(组合模型)
0.52.01.01.5
·Measuredvalue/(mgkg-1)
·Predictedvalue/(mgkg-1)2.5
60180240120
·Measuredvalue/(mgkg-1)
·Predictedvalue/(mgkg-1)300
·Predictedvalue/(mgkg-1)1008060402000
Ni
25201510500
As
0.350.280.210.140.0700
Hg
MSC鄄RF
DS鄄ANN
组合模型
线性(组合模型)
MSC鄄RFFDR
组合模型
线性(组合模型)
DS鄄ANNMSC鄄RF
组合模型
线性(组合模型)
40608020
·Measuredvalue/(mgkg-1)
100
5101520
·Measuredvalue/(mgkg-1)
25
0.070.140.210.28
·Measuredvalue/(mgkg-1)
0.35
图4 土壤重金属含量较优模型与组合模型预测散点图比较
Fig.4 Comparisonofscatterplotsbetweenthecombinedmodelandtheoptimalmodelonsoilheavymetalcontent
第12期夏 可ꎬ等:基于熵值组合模型的矿业复垦土壤重金属高光谱反演 1571
熵值法能够根据单种预测模型预测误差序列的变异程度来确定组合模型的权重系数而且计算简单[26]ꎬ提供了一种客观赋权的方法ꎮ通过利用熵值法进行模型组合ꎬ从表5中土壤重金属含量的预测结果可以看出ꎬ验证集精度相比传统单一模型验证集精度有了显著的提高ꎬ其中As的R20.91ꎬRMSE由2.00降低至1.85ꎻ对于Cd、Cr和As线性模型和非线性的组合表现出了优异的估测能力ꎬ尤其对于CdꎬR2和RPD分别由最优单一预测模型的0.83和1.76提升至0.85和2.39ꎬRMSE由0.18减少至0.16ꎻ表明利用熵值法确定的组合模型估算土壤重金属含量是可行的ꎮ图4为重金属含量实测值与预测值散点图ꎬ散点越接近于1∶1对角线ꎬ效果越好ꎬ从图中可以看出ꎬ组合模型散点较多集中在对角线附近ꎬ且散点趋势线与对角线之间的角度差很小ꎬ表明结合多种模型能够对重金属含量的预测产生一个很好的效果ꎮ由于土壤为矿物质、有机质和水分等物质组成的复杂有机整体ꎬ各成分之间相互影响、相互作用ꎬ土壤光谱易受区域性和地域性影响ꎬ因此不同区域内的土壤光谱有所差异ꎮ本文以四川古蔺矿业废弃地复垦土壤重金属为研究对象ꎬ所建立的重金属含量反演模型在其他区域的适用性还有待于进一步研究ꎮ
值达到最高ꎬ相比其最优模型R2由0.89提高至
进行较优模型组合ꎬ得到如下主要结论:
关性较弱ꎬ经不同预处理变换后ꎬ部分波段相关性有了明显的提升ꎻ其中MSC总体效果较好ꎬ对As和Ni最为明显ꎬ相关性系数极值达到0.715和次FDR对Hg较为明显ꎬ相关性极值达到0.706ꎻDS对重金属含量相对偏高的Cr的相关性起到了0.4以上ꎬ最大极值达到-0.530ꎮ
很好的提升效果ꎬ绝大部分波段相关性系数位于
(2)预处理变换和模型的选取不同对预测结-0.679ꎬ且整体波段都取得了较好的相关性ꎻ其
(1)原始土壤光谱反射率和重金属之间的相
果影响较大ꎬ利用3种精度指标对模型进行评价ꎬ其中MSC ̄RF反演效果最好ꎬ验证集As、Hg、Ni和Cd的R2、RMSE和RPD分别达到:0.89ꎬ2.00ꎬ
2.77ꎻ0.84ꎬ0.03ꎬ2.52ꎻ0.83ꎬ4.78ꎬ2.72ꎻ0.83ꎬ0.18ꎬ1.76ꎻDS ̄ANN对Cr效果较好ꎬ3种精度指标分别为:0.83ꎬ15.66ꎬ2.19ꎻ利用MSC和DS结合非线性模型效果要优于线性模型ꎬ由于这两种变换能够显著提升整体波段的相关性ꎬ为RF和ANN模型提供了大量的输入参数ꎻ结果表明ꎬ针对不同的建模应选取适宜的预处理变换方法ꎮ
(3)从单一模型和组合模型预测结果来看ꎬ
单一模型虽具有运算速度快、操作简便等优势ꎬ但组合模型能综合利用多种模型信息ꎬ减弱单一模型中随机因素带来的影响ꎬ应提高组合模型在土壤光谱预测方面的应用性ꎮ熵值法根据预测模型
4 结 论
针对高光谱反射率反演土壤重金属含量问题ꎬ本文采取4种预处理变换并结合PLS、ANN和RF3种建模方法建立矿业废弃地复垦土壤反射率与土壤重金属的单一定量模型ꎬ并采用熵值法
的变异程度确定权重ꎬ避免了权重确定的主观性ꎬ客观地反映了单一预测模型在组合模型中的重要性ꎬ利用熵值法进行两种较优模型组合ꎬ较传统单一模型ꎬ精度指标均有所提高ꎬ表明采用熵值组合模型对土壤重金属含量进行预测效果更好ꎮ
参 考 文 献:
[1]杨金中.2017年度新增的矿山恢复治理面积遥感调查工作顺利完成[EB/OL].(2018 ̄08 ̄23)[2019 ̄4 ̄20].http:/
www.agrs.cgs.gov.cn/jryw/cgkx/201809/t20180907_466923.html.
YANGJZ.2017Remotesensingsurveyofnewlyaddedminerestorationandcontrolareawassuccessfullycompleted[EB/OL].(2018 ̄08 ̄23)[2019 ̄4 ̄20].http:/www.agrs.cgs.gov.cn/jryw/cgkx/201809/t20180907_466923.html.(in[2]王维ꎬ沈润平ꎬ吉曹翔.基于高光谱的土壤重金属铜的反演研究[J].遥感技术与应用ꎬ2011ꎬ26(3):348 ̄354.
ol.Appl.ꎬ2011ꎬ26(3):348 ̄354.(inChinese)Chinese)
WANGWꎬSHENRPꎬJICX.StudyonheavymetalCubasedonhyperspectralremotesensing[J].RemoteSens.Techn ̄
[3]SRIVASTAVARꎬSARKARDꎬMUKHOPADHAYAYSSꎬetal..Developmentofhyperspectralmodelforrapidmonitoring
ofsoilorganiccarbonunderprecisionfarmingintheIndo ̄GangeticPlainsofPunjabꎬIndia[J].J.IndianSoc.RemoteSens.ꎬ
1572
2015ꎬ43(4):751 ̄759.
发 光 学 报第40卷
[4]BABAEIANEꎬHOMAEEMꎬMONTZKACꎬetal..Towardsretrievingsoilhydraulicpropertiesbyhyperspectralremote[5]沈强ꎬ张世文ꎬ葛畅ꎬ等.矿业废弃地重构土壤重金属含量高光谱反演[J].光谱学与光谱分析ꎬ2019ꎬ39(4):1214 ̄
1221.
SHENQꎬZHANGSWꎬGECꎬetal..Hyperspectralinversionofheavymetalcontentinsoilsreconstitutedbyminingwasteland[J].Spectrosc.Spect.Anal.ꎬ2019ꎬ39(4):1214 ̄1221.(inChinese)sensing[J].VadoseZoneJ.ꎬ2015ꎬ14(3):doi:10.2136/vzj2014.07.0080.
[6]李晋华ꎬ杨志良ꎬ王召巴ꎬ等.近红外漫透射技术检测玉米成分[J].红外技术ꎬ2013ꎬ35(11):732 ̄736.
redTechnol.ꎬ2013ꎬ35(11):732 ̄736.(inChinese)18(4):923 ̄945.
LIJHꎬYANGZLꎬWANGZBꎬetal..Thecorncontentmeasurementwithnearinfrareddiffusetransmission[J].Infra ̄
[7]李旭青ꎬ刘湘南ꎬ刘美玲ꎬ等.水稻冠层氮素含量光谱反演的随机森林算法及区域应用[J].遥感学报ꎬ2014ꎬ
LIXQꎬLIUXNꎬLIUMLꎬetal..Randomforestalgorithmandregionalapplicationsofspectralinversionmodelforesti ̄matingcanopynitrogenconcentrationinrice[J].J.RemoteSens.ꎬ2014ꎬ18(4):923 ̄945.(inChinese)
[8]黄仁东ꎬ张海彬ꎬ杨志辉ꎬ等.基于多准则的组合预测模型权重研究及其应用[J].中南大学学报(自然科学版)ꎬ
2015ꎬ46(5):1778 ̄1785.
HUANGRDꎬZHANGHBꎬYANGZHꎬetal..Researchandapplicationofmulti ̄criteriacombinationforecastmodel[J].J.Cen.SouthUniv.(Sci.Technol.)ꎬ2015ꎬ46(5):1778 ̄1785.(inChinese)
[9]刘伟ꎬ赵众ꎬ袁洪福ꎬ等.光谱多元分析校正集和验证集样本分布优选方法研究[J].光谱学与光谱分析ꎬ2014ꎬ
34(4):947 ̄951.
LIUWꎬZHAOZꎬYUANHFꎬetal..Anoptimalselectionmethodofsamplesofcalibrationsetandvalidationsetforspec ̄tralmultivariateanalysis[J].Spectrosc.Spect.Anal.ꎬ2014ꎬ34(4):947 ̄951.(inChinese)
[10]刘桂松ꎬ郭昊淞ꎬ潘涛ꎬ等.Vis ̄NIR光谱模式识别结合SG平滑用于转基因甘蔗育种筛查[J].光谱学与光谱分析ꎬ
2014ꎬ34(10):2701 ̄2706.
LIUGSꎬGUOHSꎬPANTꎬetal..Vis ̄NIRspectroscopicpatternrecognitioncombinedwithSGsmoothingappliedtobreedscreeningoftransgenicsugarcane[J].Spectrosc.Spect.Anal.ꎬ2014ꎬ34(10):2701 ̄2706.(inChinese)
[11]徐明星ꎬ吴绍华ꎬ周生路ꎬ等.重金属含量的高光谱建模反演:考古土壤中的应用[J].红外与毫米波学报ꎬ2011ꎬ
30(2):109 ̄114.
XUMXꎬWUSHꎬZHOUSLꎬetal..Hyperspectralreflectancemodelsforretrievingheavymetalcontent:applicationinthearchaeologicalsoil[J].J.InfraredMillim.Waves.ꎬ2011ꎬ30(2):109 ̄114.(inChinese)
[12]章明清ꎬ李娟ꎬ许文江ꎬ等.早稻氮磷钾施肥类别归属的贝叶斯判别方法研究[J].植物营养与肥料学报ꎬ2017ꎬ
23(4):1045 ̄1053.
ZHANGMQꎬLIJꎬXUWJꎬetal..Bayesiandiscriminatinganalysisoncategoryattributionofnitrogenꎬphosphorusandpotassiumfertilizationforearlyrice[J].J.PlantNutr.Fertil.ꎬ2017ꎬ23(4):1045 ̄1053.(inChinese)
[13]钟杰.光谱校正方法研究及其在土壤检测的应用[D].广州:暨南大学ꎬ2018.
tyꎬ2018.(inChinese)
ZHONGJ.ResearchonSpectralCorrectionMethodsanditsApplicationinSoilDetection[D].Guangzhou:JinanUniversi ̄
[14]尼加提卡斯木ꎬ师庆东ꎬ王敬哲ꎬ等.基于高光谱特征和偏最小二乘法的春小麦叶绿素含量估算[J].农业工程
学报ꎬ2017ꎬ33(22):208 ̄216.
KASIMNꎬSHIQDꎬWANGJZꎬetal..Estimationofspringwheatchlorophyllcontentbasedonhyperspectralfeaturesand[15]李粉玲ꎬ常庆瑞.基于连续统去除法的冬小麦叶片全氮含量估算[J].农业机械学报ꎬ2017ꎬ48(7):174 ̄179.
Chin.Soc.Agric.Mach.ꎬ2017ꎬ48(7):174 ̄179.(inChinese)53(2):023001 ̄1 ̄10.
PLSRmodel[J].Trans.Chin.Soc.Agric.Eng.ꎬ2017ꎬ33(22):208 ̄216.(inChinese)
LIFLꎬCHANGQR.Estimationofwinterwheatleafnitrogencontentbasedoncontinuumremovedspectra[J].Trans.
[16]韩兆迎ꎬ朱西存ꎬ王凌ꎬ等.基于连续统去除法的苹果树冠SPAD高光谱估测[J].激光与光电子学进展ꎬ2016ꎬ
HANZYꎬZHUXCꎬWANGLꎬetal..HyperspectralevaluationofSPADvalueofappletreecanopybasedoncontinuum ̄
第12期夏 可ꎬ等:基于熵值组合模型的矿业复垦土壤重金属高光谱反演 1573
[17]杨平ꎬ姚明印ꎬ黄林ꎬ等.LIBS检测污染马铃薯中的Pb及偏最小二乘定量分析模型[J].光电子激光ꎬ2015ꎬ
26(1):141 ̄148.
YANGPꎬYAOMYꎬHUANGLꎬetal..DetectionofPbinpotatobyLIBSandthepartialleastsquarequantityanalysismodel[J].J.Optoelect.Laserꎬ2015ꎬ26(1):141 ̄148.(inChinese)
removedmethod[J].LaserOptoelect.Prog.ꎬ2016ꎬ53(2):023001 ̄1 ̄10.(inChinese)
[18]陈元鹏ꎬ张世文ꎬ罗明ꎬ等.基于高光谱反演的复垦区土壤重金属含量经验模型优选[J].农业机械学报ꎬ2019ꎬ
50(1):170 ̄179.
CHENYPꎬZHANGSWꎬLUOMꎬetal..Empiricalmodeloptimizationofhyperspectralinversionofheavymetalcontentinreclamationarea[J].Trans.Chin.Soc.Agric.Mach.ꎬ2019ꎬ50(1):170 ̄179.(inChinese)ficialneuralnetwork[J].FoodChem.ꎬ2016ꎬ192:134 ̄141.
[19]PANLQꎬZHANGQꎬZHANGWꎬetal..Detectionofcoldinjuryinpeachesbyhyperspectralreflectanceimagingandarti ̄[20]李盛芳ꎬ贾敏智ꎬ董大明.随机森林算法的水果糖分近红外光谱测量[J].光谱学与光谱分析ꎬ2018ꎬ38(6):
1766 ̄1771.
LISFꎬJIAMZꎬDONGDM.Fastmeasurementofsugarinfruitsusingnearinfraredspectroscopycombinedwithrandomforestalgorithm[J].Spectrosc.Spect.Anal.ꎬ2018ꎬ38(6):1766 ̄1771.(inChinese)
[21]CARRANZAEJMꎬLABORTEAG.Randomforestpredictivemodelingofmineralprospectivitywithsmallnumberof[22]刘玉成.熵法确定权重的地基沉降组合预测模型[J].中国科技论文在线ꎬ2010ꎬ5(11):875 ̄878.
lineꎬ2010ꎬ5(11):875 ̄878.(inChinese)
prospectsanddatawithmissingvaluesinAbra(Philippines)[J].Comput.Geosci.ꎬ2015ꎬ74:60 ̄70.
LIUYC.Acombinedpredictionmodelforfoundationsubsidenceusingtheentropyweightmethod[J].Sciencepap.On ̄
[23]王顺利ꎬ尚丽平ꎬ李占锋ꎬ等.多元散射校正在荧光谱分析中的应用研究[J].光散射学报ꎬ2013ꎬ25(2):187 ̄191.
J.LightScatt.ꎬ2013ꎬ25(2):187 ̄191.(inChinese)
WANGSLꎬSHANGLPꎬLIZFꎬetal..Multiplicativescattercorrectionintheapplicationoffluorescenceanalysis[J].
[24]周倩倩ꎬ丁建丽ꎬ杨爱霞ꎬ等.基于实测高光谱和电磁感应的绿洲土壤含水量估测[J].干旱区资源与环境ꎬ2018ꎬ
32(3):152 ̄157.
ZHOUQQꎬDINGJLꎬYANGAXꎬetal..Estimationofsoilmoisturespatialdistributionbasedonmeasuredspectralandelectromagneticinductioninstrumentsinthearidoasis[J].J.AridLandResour.Environ.ꎬ2018ꎬ32(3):152 ̄157.(in[25]谢文ꎬ赵小敏ꎬ郭熙ꎬ等.基于组合模型的庐山森林土壤有效铁光谱间接反演研究[J].土壤学报ꎬ2017ꎬ54(3):
601 ̄612.
XIEWꎬZHAOXMꎬGUOXꎬetal..Composite ̄model ̄basedindirectreversionofsoilavailableironspectrumofforestsoilinLushan[J].ActaPedol.Sinicaꎬ2017ꎬ54(3):601 ̄612.(inChinese)Chinese)
[26]陈华友.熵值法及其在确定组合预测权系数中的应用[J].安徽大学学报(自然科学版)ꎬ2003ꎬ27(4):1 ̄6.
Sci.)ꎬ2003ꎬ27(4):1 ̄6.(inChinese)
CHENHY.Entropymethodandapplicationtodetermineweightsofcombinationforecasting[J].J.AnhuiUniv.(Nat.
夏可(1994-)ꎬ男ꎬ安徽安庆人ꎬ硕士研究生ꎬ2018年于宿州学院获得学士学位ꎬ主要从事土壤高光谱定量的研究ꎮ
E ̄mail:1015248340@qq.com
张世文(1978-)ꎬ男ꎬ安徽合肥人ꎬ博士ꎬ教授ꎬ2011年于中国农业大学获得博士学位ꎬ主要从事土壤过程定量化与时空异质性的研究ꎮEmail:mamin1190@126.com
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务