单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,主成分分析在农田土壤环境评价,中的应用,段旭东 范硕,前言,主成分分析是在一组变量中找出其方差和协方差矩阵的特征量,将多个变量通过降维转化为少数几个综合变量的统计分析方法。由于其在对高维变量系统进展最正确的综合与简化、客观地确定各个指标的权数和避开主观随便性方面的突出特点,已经被引入土地资源的开发与爱护、环境脆弱性与环境退化争论等诸多争论领域。与模糊综合评判法、灰色聚类法、综合指数法、神经网络等环境质量的定量评价方法相比,主成分分析方法具有能够削减原始数据信息损失、简化数据构造、避开主观随便性等优点,在水、土壤等环境介质中的污染物评价争论中均有应用。,名目,一、材料和方法,二、结果和分析,三、结论,一、材料和方法,1,、1,数据来源,利用中意合作典型区生态调查工程鞍山市农田土壤污染物调查数据作为主成分分析的土壤环境质量评价素材,土壤样品包括清灌稻田、污灌稻田、旱田、菜田、温室及比照区6个不同类型农田,样本总数为45个。分析指标主要考虑国家公布的土壤环境质量标准中的几种重点识别重金属和有机农药污染物(As、Hg、Cu、Pb、Cd、Cr、DDT、BHC)。,表1,不同耕作类型农田土壤污染物含量(mg/kg),1,、,2,数据处理,主成分分析的根本原理是:设有n个相关变量Xi(i=1,2,n)组合成n个独立变量Yy(i=1,2,n),使得独立变量Yi的方差之和等于原来n个相关变量Xi的方差之和,并按方差大小由小到大排列。把n个相关变量的作用看作主要由为首的几个独立变量Yi(i=1,2,m)(mn)所打算,于是n个相关变量就缩减成m个独立变量Yi,Yi(i=1,2,m),也就是主成分(principle component)。通过降维产生的新变量能够在不损失原有信息的状况下,使原有变量所代表的信息更集中、更典型的表达出来。在对土壤环境质量进展评价时可以利用主成分分析的这些特点提取主要的污染因子,并利用主成分得分进展土壤质量评级。,数据处理主要包括数据标准化,由标准化后的数据求协方差矩阵,计算特征方程中全部特征值并依据特征值累计比例确定主成分的数量,计算主成分载荷值和主成分得分,以及进展主成分评分等。,二、,结果和分析,2,、,1 主成分识别,主成分识别是以土壤污染物含量作为原变量,通过计算变量方差和协方差矩阵的特征量,将多个变量通过降维转化为少数几个综合变量,马上土壤污染物的信息进展了集中和提取,使我们能够从众多土壤污染物中识别出起主导作用的成分。由于数据中各污染物的量纲不同,各变量的作用难以直接比较,在计算时需对变量数据进展标准化处理。,表2是各污染物含量的总方差分解表,可以看出第一、其次主成分特征值占总方差的分比已经大于95%,即前两个主成分已经对8个监测指标所涵盖的大局部污染物信息进展了概括,其中第一主成分携带的信息最多,到达76%以上,第一、其次主成分的累计奉献率到达95、969%。主成分3和4对总方差的奉献很小,为了以尽可能少的指标反映尽量多的信息,选取前2个因子作为主成分,代表主要的土壤污染物指标。,表2 观测指标总方差分解表,2,、,2 主要污染物识别分析,主要污染物识别是通过土壤污染物对主成分的奉献率即主成分载荷进展分析,载荷大的即可认为是重要污染因子。表3是各变量对应于两个主成分的荷载值,载荷值反映的是主成分与变量的相关系数,可以据此写出主成分载荷表达式:,第一主成分=0、967Cu +0、888Cr +0、860Cd +0、815Pb +0、748Hg -0、108BHC -0、132DDT +0、023As,其次主成分=0、157Cu +0、443Cr +0、435Cd -0、576Pb -0、502Hg +0、787BHC +0、612DDT -0、284As,表3 主成分载荷矩阵,用这2个因子代替8个原始变量,已经概括了绝大多数土壤污染物的信息。但由于每个因子中各原始变量的系数差异不明显,需要利用方差最大旋转对因子荷载矩阵进展旋转,将因子中各变量的系数向最大和最小转化,使每个因子上具有最高载荷的变量数最少,以使得对因子的解释变得简洁。,表4是旋转后的主成分载荷矩阵,由于不同主成分对应的各变量的系数向最大和最小转化,使每个主成分上具有最高载荷的变量数最少,旋转后的荷载系数矩阵中各变量对两个主成分的荷载系数差异比较明显。可以看出,第一主成分以Cr、Cu、Cd为主的重金属奉献最大,其次主成分中BHC、DDT和重金属Pb、Hg的奉献较大。,表4 旋转后主成分载荷矩阵,图1,因子载荷散点图,表中主成份载荷的正负可以反映出污染物的复合性,在主成分载荷图中表现为对斥因子(图1)。利用旋转后的因子载荷生成的载荷散点图可以直观地看出打算因子的变量(图1)。图中横坐标和纵坐标分别代表提取出的第一主成分和其次主成分,变量与原点的距离反映其因子载荷,位于坐标轴原点远端的变量具有较大的因子载荷,位于原点近端的变量具有较小的因子载荷。,对变量进展的相关关系检验,可以进一步反映土壤污染物间的相关关系(表5)。,表5 污染物相关系数矩阵,可以看出,重金属Hg-Pb、Cd-Cu、Cr-Cu、Cr-Cd间具有很强的相关性,这在肯定程度上反映了几种土壤重金属污染物的同源性、差异性以及在农田土壤中的组合状况。尽管BHC和DDT类农药在我国已停用多年,但在土壤中仍有肯定残留,二者的相关系数到达0、508,反映出该区域过去的农药使用状况。这两种化学物质属于人工合成物质,其含量多少与其他元素没有内在的联系,它们与重金属元素的相关性亦不显著。BHC和DDT的施用大多在旱田和菜地,而污灌区有大量的外源重金属污染物随着浇灌用水输入,因此农药与绝大多数重金属呈负相关关系可以在肯定程度上反映出土地利用状况和耕作方式对土壤污染物含量的影响。,2、3 土壤质量分级结果,由于主成分得分可以反映观测量的状况,并依据主成分得分状况进展排序,得分较低观测值含有较少的信息,得分最多的观测值包含最多的信息。在进展土壤环境评价时可以利用主成分得分,利用不同类型农田土壤污染物的主成分得分来对农田土壤环境进展排序。表6为各主成分的得分系数,依据得分系数可以计算每个观测值在各个污染指标上的得分数,并据此进展进一步的分析。主成分得分(FAC)的表达式为:,FAC-1=-0、009Cu+0、000Cr+0、000Cd+0、069Pb+0、000Hg-0、000BHC-0、000DDT-0、009As,FAC-2=-0、120Cu-0、609Cr+0、000Cd+1、149Pb-0、000Hg+0、000BHC+0、000DDT+0、033As,表6 主成分得分系数,将不同土壤污染物浓度值与相应主成分得分系数的乘积相加得到土壤污染物的主成分得分(表7)。主成分得分可以反映污染物对土壤的综合作用和土壤环境质量状况,得分越低代表土壤污染物含量越低,即土壤环境质量越好。从表中6种类型的农田土壤污染物总得分排序结果可以看出,清灌稻田的土壤环境质量最高,以下依次是比照区、旱田、大棚和菜田,利用污水进展浇灌的污灌稻田土壤综合得分最高,反映出污灌稻田污染物含量较高,土壤环境质量较差。,表7 不同类型农田污染物主成分得分排序,三、,结论,利用主成分分析有效地提醒土壤污染物的数据构造和土壤污染物间的内在相关性及差异性,并很好地识别出土壤污染物的主要成分。分析结果根本上反映了不同耕作类型下土壤污染物的组合状况及对污染负荷的奉献率,可以看出外源重金属输入对当地农田土壤环境质量的影响高于有机农药残留,是当地农田土壤环境质量的主要影响因子。,