单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/2/8,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第六章 遥感专题信息提取,第一节 遥感图像解译概述,一、,遥感图像解译(,Imagery Interpretation,)的概念,遥感图像是地物电磁波特性的实时记录。遥感图像能够提供给解译者的信息有:,目标的光谱特征信息 主要由地物的类别、性质的差异决定,目标的空间位置特征,目标随时间的动态信息,不同的目标,在上述性质和特征上是不同的,所以,,遥感图像解译定义为:根据遥感图像所提供的影像特征及其对应目标的特点进行,推理和判断将目标识别出来,并进行定性、定量分析的工作就称为遥感图像解译(判读),遥感图像解译(判读)的,本质,就是:利用遥感图像提供的各种数据,再结合解译者的学识,和经验,确定空间什么位置(,Where-Position,)有什么目标(,What-Qualitative,)有多少,(How-Quantitative,),但是,遥感图像上的信息并非直接呈现出来,而是通过图像上复杂形式的色调、结构及它们的变化表现出来,因此要正确的认识它们必须具备相应的知识,第六章 遥感专题信息提取 第一节,1,二、图像解译的背景知识,专业知识,指需要熟悉所解译的学科及相关学科的知识。包括对地物成因联系、,空间分布规律、时相变化以及地物与其他环境要素间的联系等知识。比如遥感地质探,矿,首先需具备地层、构造、蚀变带等与找矿直接相关的地质知识和经验,还需要了解,植物分布、土壤等相关知识。,地理区域知识,指区域特点、人文自然景观等。每个区域有其独特的区域特征,,即地域性,它影响到图像的图型结构等,它能直接帮助识别地物和现象,遥感系统知识,解译者必须了解每一图像是怎样生成的;不同遥感器是如何描述,景观特征的,它使用的何种电磁波段,空间分辨率是多少等等,怎样从图像中获得有,用的信息等,遥感图像解译与日常目视观察有,3,点不同:,A,遥感图像通常为“顶视,-,鸟瞰”,而不同于日常生活中的透视,B,遥感图像常用可见光以外的电磁波段,而大多数我们熟悉的特征是在可见光谱段,,可以表现得十分不同,C,遥感图像常用一种不熟悉或变化的比例和分辨率描述地球表面,二、图像解译的背景知识专业知识 指需要熟悉所解译的,2,因此,对于初学者需要多对照地形图、实地或熟悉地物观测,以增强立体感和和景深,印象,纠正视觉误差,积累图像判读经验,遥感图像的解译过程是地面目标成像过程的逆过程,即从地面实况的模拟影像中提取,遥感信息、反演地面原型的过程,三、遥感图像解译的两种方式,目视解译(,Visual Interpretation,),借助人眼的观察和人的智能,结合一些量测工具(测微尺、放大镜、立体镜等)来,识别图像中的目标。特点:解译者的学识和经验在判读中起主要作用,精度高,但难以,对海量空间信息的定量化分析,2,计算机图像理解(,Computer Imagery Understanding,),以计算机软硬件为支撑,利用模式识别技术(,Pattern Recognition,)和人工智能,(,Artificial Intelligence,)技术,建立图像解译专家系统(,Experts System),从而,让计算机模拟人工解译过程,,“,读取遥感图像上的特征,”,,进而确定图像上的目标。,特点:速度快,处理方式灵活多样,整个处理过程通常是以人机交互方式进行,,对计算机技术和算法要求较高,识别的精度通常不及目视解译,因此,对于初学者需要多对照地形图、实地或熟悉地物观测,以增强,3,第二节 遥感图像目视解译标志,一、解译标志的概念,解译标志,(,Interpretation Mark,):遥感图像上能帮助人们识别不同目标的那些影像,特征;,直接解译标志:,能在遥感影像上直接看到可供判读的影像特征称为直接判读,标志,如形状、大小、阴影、纹理、色调等;,间接解译标志:,指运用某些直接解译,标志,根据地物的相关属性等地学知识,间接推断出的影像标志,如根据道路与河流,相交处的特殊影像特征,可以判断渡口;根据植被、地貌与土壤的关系,来识别土壤,类型和分布(如温带针叶林区多为灰化土),二、常用的解译标志,色调(,Tone,) 指地物反射、辐射电磁波的性质和能量强弱在影像上的表现,说明两点,:,a,解译者必须了解该解译图像中影像色调的支配因素 如可见光和,近红外图像均反映地物“反射”波谱特征的差异,涉及地物的物质组成、水分含量等;,而热红外图像则反映地物“发射”波谱特征的差异,是地物温度差异的记录;雷达图像,反映地物后向散射能量的差异,涉及到地物介电常数、表面粗糙程度等物理性质,b,影像色调受到多种因素的影响 除了受目标本身的波谱特征因时因地、,因环境变化而变化外,还受到成像高度、成像时间(光照角度、强度)、遥感器,第二节 遥感图像目视解译标志一、解译标志的概念解译标志(,4,观察角度、成像后处理等多种因素的影响,因此使用色调标志时要特别小心,影响影像色调变化的因素:,(,1,)地物本身的颜色,(,2,)地物表面的结构 表面结构不一致,其光滑程度有差异,反光能力就不同,反映,在影像上的色调就不相同,a,光滑表面(镜面反射,S,pecular Reflection,)若传感器照射方向与太阳入射,方向一致,此时影像呈暗色调;若传感器照射方向逆着镜面反射的方向,则,影像呈亮色调,b,无光泽表面(粗糙表面,,漫反射,Diffuse Reflection,) 各方向上光线被均匀,散射开来,因此无论哪个方向得到的影像色调均一,c,起伏不平的表面 阳坡(,Adret-Sunny Slope,)影像色调亮,阴坡(,Ubac-Shady Slope,)影像色调暗,(,3,)地物本身的反光能力,(,4,)湿度的大小 通常湿度越大则影像色调越暗 利用此特征可以监测土壤湿度,(,5,)摄影季节的不同 春季植物色调浅,夏季色调深,观察角度、成像后处理等多种因素的影响,因此使用色调标志时要特,5,阴影(,Shadow,) 指因倾斜照射,地物自身遮挡光源而造成影像上的暗色调,阴影分为本影和投落阴影,前者是地物背光面在影像上呈现的暗色调构像,有助于,获得目标的立体感;后者是地物背光方向地物投射到地面的暗斑在影像上的构像,,它反映地物的侧面形态,可以根据侧影的长度及照射角度反算地物的高度,但是,因为阴影的遮盖会掩盖一些信息,给解译工作带来不便,大小(,Size,)指地物长、宽、高、面积、体积等在影像上的记录,地物影像的大小不仅能求得地物的数量特征,而且对判读地物的性质也有帮助。,例如,单轨铁路和双轨铁路从形状上往往不易区分,但通过量算其宽度则很容易区分,地物影像的大小取决于影像的比例尺大小。因此,解译前要获得影像的比例尺,形状(,Shape,)是目标物的外形、轮廓,a,遥感图像记录的是目标物的顶面形状,不同于地面看的侧面形状,b,自然形成物往往形状复杂,不规则,轮廓边界呈现较圆滑自然的曲线 如河曲,冲击扇、火山锥等;人为活动的产物一般具有规则的几何形状,拐角明显呈,一定角度,如田块、果园、城镇建筑物等,c,影像的比例尺和分辨率对形状影响较大,小比例尺时,往往呈现的是综合体,的形状,阴影(Shadow) 指因倾斜照射,地物自身遮挡光源而造成影,6,纹理(,Texture,)是指具有不同色调和形状的细微影像按某种规则排列组合的集合,,这种细微影像称为纹理基元。它往往是指图像上地物表面质感(平滑、粗糙、细腻等),如,“,花格子衬衫,”,(强调单个事物的重复规则排列,如果园果树的株行距、集约化程度,高的田块排列,贵州山区梯田的排列),图案(,Pattern,),即图型结构,是指多个人工目标重复排列的空间形式,它反映地,物目标的空间分布特征。如建筑物、道路、绿化带形成的住宅区的图案,位置(,Site,)即地理位置,它反映地物所处的地点与环境,地物与周边的关系,如菜地多分布于居民点周围与河流两侧;机场多在大城市郊区的平坦地;堤坝与道路,(形色难分),堤在河流两侧并与之平行,道路与居民点相连;有的植物生长于高地,,有些只能生长在湿地,组合(,Association,)指某些目标的特殊表现和空间组合关系,它不同于那种严格按,图型结构显示的空间排列,而指物体间一定的位置关系和排列方式,即空间配置和布局,如砖场由高烟囱、取土坑、堆砖场等组合而成;军事目标可能有雷达站、军车、军营及,周围的配套的军事设施等,纹理(Texture)是指具有不同色调和形状的细微影像按某种,7,第三节 遥感图像的目视解译,一、目视解译的原则,从应用的目的出发,总体观察,全面分析图像特征。坚持先易后难,由粗入细,由,整体到局部的原则,应充分利用各种解译标志,包括直接标志和间接标志,相互补充,彼此验证,随着多光谱和多平台遥感技术的发展,应尽可能创造条件开展多波段、多时相、,多类型遥感图像的对比分析,二、目视解译的基本过程,第三节 遥感图像的目视解译一、目视解译的原则二、目视解译的,8,准备阶段,根据解译的目的和经费的支撑选择适当空间分辨率、时相、光谱分辨率的遥感数据,并进行波段组合进行彩色增强;尽量收集到质量好、现势性较强的地形图及有关专业,图件和文字资料;编写解译标志表及说明草稿(这是一编检索表的过程,工作量大);,野外选择典型地区进行粗查,为建立合理的解译标志表打好基础。,室内图像解译阶段,按解译的基本原则进行,对无法解译或把握不大的区域应记录下来,有待野外验证,野外验证与补充解译阶段,成果整理与制图总结阶段,三、遥感解译过程的复杂性(,Complexity,),1,遥感图像显示的是某一特定地理环境的综合体,这种综合表现在两个方面:,a,地理要素的综合 它反映的是地质、地貌、水文、土壤、植被、社会生态等,多种自然、人为要素的综合,这些因子是密切相关、交织在一起,往往难以区分,b,遥感信息本身的综合 遥感图像可以是不同时间、空间、光谱、辐射分辨率的综合,遥感数据对应的地理环境又是一个复杂的、多要素的、多层次的、具有动态结构和,准备阶段三、遥感解译过程的复杂性(Complexity),9,明显地域差异的开放巨系统,它在时间和空间上是不断变化的,因而遥感信息中的,诸要素是相互关联、复杂变化的,因此,遥感解译过程是复杂的,主要体现在:,1,地物波谱特征是复杂的,它受多种因素控制,本身也因时因地而变化,2,自然界存在着大量的,“,同物异谱,”,和,“,同谱异物,”,现象,3,地物的时空属性和地学规律是错综复杂的,各要素、各类别之间的关系是多种类型的,地带性规律:由于太阳辐射随纬度分布的规律性,造成沿纬度的水平地带性现象,由于,温度、湿度等随地形高度分布的规律性造成沿高度的垂直地带性现象,植物从播种到,成熟的季节性变化规律等;有的具有随机性、不确定性,如自然灾害;有的具有模糊性,存在过渡渐变关系,如气候带、草场类型的变化等,为了提高解译过程的正确性、可靠性,必须,补充必要的辅助数据(,Ancillary,)和先验,知识(,Priori Knowledge,),-,指地学、生物学、物理学、数学等专业知识,在,GIS,的支持,下,发展一系列相关的、多层次的、综合的应用分析方法,进行遥感与地学综合分析,明显地域差异的开放巨系统,它在时间和空间上是不断变化的,因而,10,第四节 模式识别(,Pattern Recognition,)概述,遥感图像的计算机分类是模式识别技术在遥感领域的具体应用,是遥感图像应用处理,的重要内容和关键技术之一。首先提及关于模式识别的基本概念,一、基本概念,类别(,Category,)是与概念(,Concepts,)或原型(,Prototype,)相关的“自然”状态或,对象种类。假定有,c,个类别, ,也称为,解释空间(,Interpretation Space,)。解释空间有概念驱动(,Concept-Driven,)的属性,,如类别的联合、交叉等,2,模式(,Pattern,)是对象的“物理”描述 。通常是信号、图像或简单的数值表。也常把,模式称为对象、案例或样本。,特征(,Feature,) 是从模式得到的对分类有用的度量、属性或基元(,Primitive,),所以特征选取是门艺术。,二、模式识别的方法,数据聚类(,Clustering,),是用某种相似性度量的方法将数据组织成有意义的和有用的,各组数据。数据聚类不需要利用已知类的信息,它是一种非监督学习的方法,解决方案是,数据驱动的,第四节 模式识别(Pattern Recognition),11,统计分类 (,Statistical Classification,) 最为经典的模式识别方法,在选取,训练区的基础上,估计出每类型的统计特征参数(均值向量和协方差矩阵),从而,确定每类型的概率分布密度函数,进而建立判别函数,实现对待分像元进行分类。,这种分类方法是建立在多元变量的多元正态分布的假设基础上的。,这是一种监督学习方法。,神经元网络 (,Artificial Neural Network,)是以数学算法结合计算机程序来,模拟人的物理神经元之间的联系方式和思维过程,通过反馈控制的方式来调整神经,元之间的联系权重,进而使神经元的实际输出无限的逼近期望输出,这一过程通过,迭代方式来训练神经元网络。这是一种非线性的数学方法,并且是与“模型无关”,也,就是它无须对数据的分布作出假设。,存在的不足,(,1,)关于神经网络的数学解释很复杂(,2,)对于一些重要的决策,设计者,常常没有理论依据,因此必须进行大量的试验,并从试验的失败中得到启发从而不断,改进神经网络(,3,)从神经网络得不到任何的语义的信息,统计分类 (Statistical Classificati,12,4,结构模式识别 其基本思想是:任何一个具有意义的物理模式都具有良好的,结构性,它是由许多已知类别和性质的子模式或源模式(也称模式基元),按照一,定的规则构成的组合件,所以一旦知道生成规则和子模式、源模式,便可由,“,模式,描述,”,语句的文法推理出一个用字符串来表示的模式集合。若所研究的模式被包含在,此集合内,就认为该模式被识别出来了。此法至今在遥感图像识别分类中尚未得到,实际应用,有待进一步开发,5,模糊模式识别 人在进行识别时可以根据一些模糊的印象就能做到比较准确的,判断。然而,计算机是建立在,0,、,1,二值逻辑基础上的,它对事物的分析的结论是,“,非假,”,即,“,真,”,。这种二值逻辑不适宜处理模糊事物。根据人辨识事物的思维逻辑,吸取,人脑的识别特点,模糊集合论(,Fuzzy Set Theory,)把数学从二值逻辑转向连续逻辑,这就更接近人类大脑的识别活动了。由此产生了一种相当独特的识别方法:模糊识别,4 结构模式识别 其基本思想是:任何一个具有意义的,13,第五节 遥感图像计算机分类概述,一、遥感图像计算机分类的概念,就是将遥感图像中每个像元根据其在不同波段的光谱亮度、空间结构特征或其他信息,按照某种规则或算法划分为不同的土地覆盖类型专题的技术过程。,二、遥感图像计算机分类(模式识别)的种类,光谱模式识别,(,Spectral PR,),是指根据像元到像元的光谱信息来自动划分土地,覆盖类型的分类过程的总称。它只考虑了地物在光谱辐射方面的差异。,空间(结构)模式识别(,Spatial or Structural PR,)是指图像像元根据和它,周围像元的空间关系来进行图像分类。空间关系主要是指:图像的结构、像元的近似度,特征的大小、形状、方向性、分形维、扁率、重复度和上下关系等空间特征。这种,方法比光谱模式识别过程更复杂,而且计算算法上更精深。,时间模式识别(,Temporal PR,)是指在特征鉴别中将时间作为一种辅助信息,利用,多时相的遥感数据动态的进行土地覆盖类型的分类,说明:遥感图像分类没有唯一,“,正确,”,的方法,因此可以将它们结合在一起运用,形成,混合模式(,Hybrid Pattern,),第五节 遥感图像计算机分类概述一、遥感图像计算机分类的概念,14,三、遥感图像计算机分类的方式,按照在分类过程中分类者的参与程度,将分类分为两种方式:,监督分类(,Supervised Classification,),非监督分类(,Unsupervised Classification,),四、遥感图像计算机分类的原理,这样,图像中的任何一个像元就可以用一,n,维的光谱值向量来描述:,式中:,x,ji,代表第,j,个波段上第,i,号,像元的亮度值,i=1,2,N,,,N,代表每个,波段图像中像元的个数,这样,,任何一像元点的光谱向量,对应着,n,维欧氏空间的一个点,三、遥感图像计算机分类的方式四、遥感图像计算机分类的原理这样,15,若某两个像元属于同一地物类型,则它们在欧氏空间中就应该集结在一起;相反,若,两个像元分别属于不同的地物类型,则它们在欧氏空间中就应该彼此分离。,分类图像(类码标记图像),若某两个像元属于同一地物类型,则它们在欧氏空间中就应该集结在,16,假设分割,A,、,B,两个点集的曲面(图中是两维变量因此是直线)表达式为:,则方程 称为,A,、,B,两类的判别边界(,Decision Boundary,),在 已经确定以后,特征空间中任意一点是属于,A,类?还是属于,B,类?根据,几何学知识可知:当 时,当 时,上述的确定样本点所属类别的规则称为判别准则(,Decision Criteria,),,称为判别函数(,Decision Function,),遥感图像分类算法的核心就是确定判别函数 和相应的判别准则,为了,保证所确定的判别函数能够将各类地面目标在特征空间中的点分割开来,通常是,在一定的准则(如,Bayes,分类器中误分概率最小准则等)下求判别函数和相应的,判别准则。,假设分割A、B两个点集的曲面(图中是两维变量因此是直线)表达,17,五、特征选择与特征变换,在遥感图像分类之前,为了压缩参与分类多光谱图像数据的维度和找到那些对识别,感兴趣的地物类型最为有效的“特征图像”,通常需要进行特征选择,(,Feature Selection,),和特征提取,(,Feature Extraction,)。在分类时我们总是希望,用最少的影像数据取得最好的分类结果,,这样就需要从多光谱图像中选择最佳的特征,影像组合进行分类,这就称为特征选择。,将原始多光谱图像通过一定的数学变换(如,主成分、缨帽变换、植被指数变换等)生成一组进行了信息融合的新的特征图像,这种,技术手段就称为特征变换。,特征选择时,除了凭借研究者的定性判断进行特征选择外,通常可用一些定性的指标,计算来帮助进行特征选择,这些指标主要有:,距离测度,(,Distance Measure,),距离是最基本的类别可分性的测度,如果所选择的特征图像能使感兴趣的目标类别,的类内距离最小,而与其它类别的类间距离最大,则用这组特征图像设计的分类器,分类效果一定很好,五、特征选择与特征变换特征选择时,除了凭借研究者的定性判断进,18,如果将所有的特征图像都计算这一,参数值,通过比较找到参数值最大,的那个特征图像,即是最佳的分类,特征图像,变换离散度(,Transform Divergence,),衡量遥感数据各地物类型可分性好坏的数量指标常采用变换离散度和,JM,距离。离散度,(,Divergence,)是具有分布重叠度的两个类型之间可分性的数量测度。若遥感图像中,各类型的光谱矢量遵从或近似遵从多元正态分布,则图像中每两个类型之间的离散度,定义为:,式中: 表示求矩阵的迹, 和 分别是第,i,类型和第,j,类型的协方差矩阵,和 分别为第,i,类型和第,j,类型的光谱均值向量,实际应用时,常采用变换离散度公式定义光谱类型间的可分性,变换离散度定义为:,如果将所有的特征图像都计算这一变换离散度(Transform,19,当需要研究,M,个类型之间的可分性时,通常是考察,M,个类别间的平均离散度,它定义为:,式中:,M,是选定地物的类型数, 是第,i,类型的,的先验概率。,最优指数公式,OIF,(,Optimum Index Formula,),在前面假彩色合成时已介绍,当需要研究M个类型之间的可分性时,通常是考察M个类别间的平均,20,Classification Accuracy Assessment,Another area that is continuing to receive increased attention by remote sensing specialists is that of classification accuracy assessment. Historically, the ability to produce digital land cover classifications far exceeded the ability to meaningfully quantify their accuracy. In fact, this problem sometimes precluded the application of automated land cover classification techniques even when their cost compared favorably with more traditional means of data collection. The lesson to be learned here is embodied in the expression “ A classification is not complete until its accuracy is assessed”.,Classification Accuracy Assess,21,Classification error matrix,One of the most common means of expressing classification accuracy is the preparation of a classification,error matrix (sometimes called a confusion matrix or a contingency table).,Error matrices compare, on a category-by-category basis, the relationship between known reference data (ground truth) and the corresponding results of an automated classification. Such matrices are square, with the number of rows and columns equal to the number of categories whose classification accuracy is being assessed.,Table 7.3 is an error matrix that an image analyst has prepared to determine how well a classification has categorized a representative subset of pixels used in the training process of a supervised classification. This matrix stems from classifying the sampled training set pixels and listing the known cover types used for training (columns) versus the pixels actually classified into each land cover category by the classifier (rows),Classification error matrixOne,22,遥感技术与应用6遥感专题信息提取课件,23,Several characteristics about classification performance are expressed by an error matrix. For example, one can study the various classification errors of omission (inclusion). Note in the above table that the training set pixels that are classified into the proper land cover categories are located along the major diagonal of the error matrix (running from upper left to low right). All non-diagonal elements of the matrix represent errors of omission or commission. Omission errors correspond to non-diagonal column elements (e.g., 16 pixels that should have been classified as “sand” were omitted from that category). Commission errors are represented by non-diagonal row elements (e.g., 38 “urban” pixels plus 79 “hay” pixels were improperly included in the “corn” category).,Several other descriptive measures can be obtained from the error matrix. For example, the overall accuracy is computed by dividing the total number of correctly classified pixels (i.e., the sum of the elements along the major diagonal) by the total number of reference pixels. Likewise, the accuracies of individual categories can be calculated by dividing the number of pixels in the corresponding row or column.,Several characteristics about,24,What are often termed producers accuracies result from dividing the number of correctly classified pixels in each category (on the major diagonal) by the number of training set pixels used for that category (the column total). This figure indicates how well training set pixels of the given cover type are classified.,Users accuracies are computed by dividing the number of correctly classified pixels in each category by the total number of pixels that were classified in that category (the row total). This figure is a measure of commission error and indicates the probability that a pixel classified into a given category actually represents that category on the ground.,Note that the error matrix indicates an overall accuracy of 84%. However, producers accuracies range from just 51% to 100% and users accuracies vary from 72% to 99%. Furthermore, this error matrix is based on training data.,It should be remembered that such procedures only indicate how well the statistics extracted from these areas can be used to categorize the same areas.,What are often termed producer,25,If the results are good, it means nothing more than that the training areas are homogeneous, the training classes are spectrally separable, and the classification strategy being employed works well in the training areas. This aids in the training set refinement process, but it indicates little about how the classifier performs elsewhere in a scene. One should expect training area accuracies to be overly optimistic, especially if they are derived from limited data sets.,A further point to be made about interpreting classification accuracies is the fact that ever a completely random assignment of pixels to classes will produce percentage correct values in the error matrix. In fact, such a random assignment statistic is a measure of the difference between the actual agreement between reference data and an automated classifier and the chance agreement between the reference data and a random classifier. Conceptually, K=(observed accuracy chance agreement)/(1-chance agreement),If the results are good, it me,26,This statistic serves as an indicator of the extent to which the percentage correct values of an error matrix are due to “true” agreement versus “chance” agreement. As true agreement (observed) approaches 1 and chance agreement between 0 and 1. For example, a k value of 0.67 can be thought of as an indication that an observed classification is 67 percentage better than one resulting from chance. A k value of 0 suggests that a given classification is no better than a random assignment of pixels. In cases where chance agreement is large enough, K can take on negative values-an indication of very poor classification performance. (Because the possible range of negative values depends on the specific matrix, the magnitude of negative values should not be interpreted as an indication of relative classification performance),This statistic serves as an in,27,六、分类结果的质量评价,在遥感图像的分类问题中常以混淆矩阵,(,Confusion Matrix,)来表示分类结果的精度,混淆矩阵定义如下:,(Usually, this matrix was derived from the validation,dataset(ground truth )the user specified.),式中:,m,ij,表示本应属于第,i,类结果被分入,第,j,类中去的像元总数,n,表示总的类别数,所以,该矩阵的主对角线上的元素值越大,则说明分类的效果越好,六、分类结果的质量评价式中:mij表示本应属于第i类结果被分,28,若通过分类获取了上述混淆矩阵,可以计算基本的精度估计量:,1,总体分类精度 正确分类的总像元数(主对角线上元素的和)与参加分类评价的,总像元数(矩阵中所有元素之和)之比,表示为,用户精度 每一类别被正确分类的像元数量除以被分作该类的总像元数,(列元素之和),表示为,生产者精度,每一类别被正确分类的像元数量除以该类用作分类训练的总像元,(行元素之和),表示为,若通过分类获取了上述混淆矩阵,可以计算基本的精度估计量:,29,一、无监分类的概念,在对研究区不了解的情况下,只是依据每一类型地物所具有的相似性(,Similarity,,类似度,),,把反映各类型地物特征值的分布按相似分割和概率统计理论将各像元,归并成不同的空间集群,然后结合地面实地调查来确定各集群的地物类型从而达到,识别分类目的的分类方法。,其数学基础是:多元统计的聚类分析,(,Clustering Analysis,),第六节 遥感图像计算机无监分类,Kappa,分析,一、无监分类的概念第六节 遥感图像计算机无监分类Kappa,30,二、非监督分类的特点,分类者不需要对研究区有广泛的了解和熟悉,但分类结束后仍需要一定的知识或,地面调查来确定各集群的地物覆盖类型,人为误差的机会减少,因为分类者参与的程度低,只需要事先设定几个参数即可,非监督分类产生的光谱集群组并不一定对应于分析者想要的类别,分析者较难对产生的类别进行控制,三、非监督分类的算法,K-Mean,算法,其基本思想是通过迭代,逐次移动各类别的中心,直到后一次获得的各类的中心,与前一次聚类获得的中心不再发生移动为止。,具体步骤,:假设图像上的目标要分成,m,类,,m,事先由分类者指定,(,1,)适当地选取,m,个类的初始中心 ,初始中心的选择对聚类的,结果有一定的影响,初始中心的选择一般有以下方法:,二、非监督分类的特点三、非监督分类的算法,31,1,),根据问题的性质,根据经验确定类别数,m,,从数据中找出从直观上看来比较合适,的,m,个类的初始中心,2,)将全部数据随机地分成,m,个类别,计算每个类别的重心,将这些重心作为,m,个类的,初始聚类中心,(,2,),在第,K,次迭代中,对任一样本,X,按如下方法把它调整到,m,个类别中的某一类别,中去。对于所有的 ,如果:,(,3,)由第(,2,)步得到 类新的中心,1)根据问题的性质,根据经验确定类别数m,从数据中找,32,(,4,)对于所有的,则迭代结束,否则转到第二步继续进行迭代,Y,N,开始,选择,m,个聚类中心,z,1,z,2,z,m,所有像元分到,m,个聚类中心,计算新的聚类中心,聚类中心不变,结束,K,均值算法框图,说明:,这种方法的聚类结果受,所选聚类中心的数目及其初始,位置以及模式分布的几何性质,和读入次序等因素影响,并且,在迭代过程中没有调整类别数,的措施,(4)对于所有的YN开始选择m个聚类中心z1,z2,zm,33,ISODATA,算法,ISODATA(,Iterative Self-Organizing Data Analysis Techniques Algorithm,,,迭代自组织数据分析技术算法),它与,K-Mean,算法有两点不同:,第一,它不是每调整一个样本的类别就重新计算一次各类样本的均值,而是在每次,把所有样本都调整完后才重新计算一次各类样本均值,前者被成为,“,逐个样本,修正法,”,,后者被成为,“,成批样本修正法,”,第二,,ISODATA,算法可以自动进行类别的,“,合并,”,与,“,分裂,”,,从而得到类别数比较合理,的聚类结果,所以类别数是动态的,A,分类前预定义参数,(,1,)打算分类的最大类别数,C,max,和最小类别数,C,min,(,2,)迭代过程中,最大类别保持不变的像元数量百分比,当达到这个百分比时,,ISODATA,算法停止,(,3,)每个类别中最小的像元数量、最大的标准方差,(,4,)最小的集群均值间距离,如果两个类别间距离小于这个值,则两类合并,(,5,)集群分散值,通常为,0,ISODATA算法A 分类前预定义参数,34,B,ISODATA,算法的基本步骤,(,1,)初始随机选取,C,max,个中心,(,2,)计算其它像元到这些中心的距离,按照最小距离规则将各像元划分到其对应的,类别中去,(,3,)重新计算每个类别的均值,按照前面定义的参数合并或分裂相关类别,(,4,)重复(,2,)、(,3,),直到达到最大不变像元百分比或最大迭代次数为止,第七节 遥感图像的计算机有监分类,一、有监分类的概念,利用对研究区已有类别的先验知识从遥感图像上选取若干有代表性的训练区作为样本,据此估计出各类别的统计特征参数(主要是指均值向量和协方差矩阵),进而建立判别函数,然后利用判别函数实现对待分类像元进行分类的方法。,有监分类的数学基础:多元统计的判别分析(,Discriminant Analysis,),B ISODATA算法的基本步骤第七节 遥感,35,训练区,(,Training Area,),:是分类者事先已知地物的类别然后从遥感图像上相应,位置“圈定”的一定数量像元所构成的样区,,其目的是,用来对计算机进行“训练”,让,计算机学习到描述不同类别地物特征(主要是统计特征,均值向量和协方差矩阵),为建立基于统计学的判别函数打下基础。训练区选取的好坏决定分类的成功与否,,因此选训练区是,“艰辛的、科学的、艺术的”,分类者选训练区的,要求:,A,代表性 通常在每种类型地物所对应图像的中心地带选训练区,避免不同类型在,边缘相交处相互混杂,使训练区像元光谱“不纯”,B,完备性 是指选取训练区类型数要与待分的类型数相对应;对于某些类别,如,水体,可能有清洁的、含泥沙的水、富营养化的水,每种都必须选,综合,后共同体现水体的“统计特征”,分类者选训练区的,方式:,A,多边形(,Polygon),或区域方式选取:适用于大片集中分布的地物类型,B,多边形线(,Polyline,)方式:适用线状分布的地物,如道路、河流等,C,点方式(,Point,):适用于零星的小面积分布的地物类型,上述选训练区的方式可以交互使用,训练区(Training Area):是分类者事先已知地物的,36,二、有监分类的过程,根据对研究区的了解(先验知识),从图像中选择有代表性的训练区(样本),对选出的样本依据选用的分类器进行统计分析处理,提取各类型的数据特征,并以此建立适用的判别准则,使用该判别准则逐个判定各像元点的类别归属,输出经过类码标注的分类结果图像,图像数据,判决准则,像元归类,输出分类结果图像,选训练样区,样本统计分析,各类数据特征,遥感图像有监分类工作流程示意图,二、有监分类的过程图像数据判决准则像元归类输出分类结果图像选,37,三、有监分类的算法,1,最小距离法,(,Minimum Distance,):利用所选训练样本估计出每一类型的均值,向量和协方差矩阵;然后以均值向量作为该类在特征空间中的中心位置,计算每个待,分类像元到各类中心的距离,然后将此像元归并到距离最小的一类中去。此方法的,判别准则是,距离,设,n,维多光谱图像中任一待分类像元,X,i,用,n,维向量表示为:,则该像元到第,K,类中心的距离可用下面公式计算获得:,三、有监分类的算法则该像元到第K类中心的距离可用下面公式计算,38,欧氏距离,欧氏距离,39,2,马氏距离法,马哈拉诺比斯(,Mahalanobis,)距离,式中:,X,i,是第,i,个待分类像元的亮度值向量,M,k,是第,k,个类别中心的亮度均值向量,Covariance Matrix,2 马氏距离法马哈拉诺比斯(Mahalanobis,40,马氏距离由于乘上了协方差矩阵的逆,因此它具有“统一量纲”的效应;当协方差,矩阵退化为单位阵(,Identity Matrix,)时,马氏距离就变成了欧氏距离,3 Bayes,判别准则,前面介绍的距离判别方法计算简单,结论明确,简单实用。但其缺点是:判别方法,与各类出现的概率大小无关,同时与误判之后造成的损失无关。而,Bayes,判别可以,很好的克服上述缺点,原理:假定先考虑两个总体,G,1,和,G,2,,它们分别具有概率密度函数,f,1,(x),和,f,2,(x),,,设,G,1,和,G,2,出现的先验概率为,P,1,=P(G,1,),,,P,2,=P(G,2,),,,P,1,+P,2,=1,A,先验概率(,Priori Probability,):未观测前已知某一样本,X,来自于每个总体,的概率,如前面的,P1,、,P2,B,条件概率(,Conditional Probability,):已知在总体,G1,和,G2,出现的条件下,观测,到样本,X,的概率,P(X/G,i,)i=1,2,称为条件概率,C,后验概率(,Posteriori Probability,):已知样本,X,出现的条件下,它是来自于,总体,G,i,i=1,2,的概率,也就是样本属于总体的概率,P(G,i,/X,),马氏距离由于乘上了协方差矩阵的逆,因此它具有“统一量纲”的效,41,由,Bayes,定理有:,从上式看,P(X),是一个与类别无关的公共因子,在比较后验概率时不起作用,判别时,可以将它去掉。所以它的判别准则就是:,比较上式的大小:,先验,概率,P(G,i,),,通常根据各种先验知识(具体问题的实际情况、历史上积累的,资料等)给出,或假设它们相等,条件概率,P(X/G,i,),,由于遥感问题中像元亮度值正态分布假设的合理性及非正态,问题可以通过数学方法转化为正态问题来处理,因此都假定,满足正态分布的条件,一元正态分布的概率密度函数写为:,由Bayes定理有:从上式看P(X)是一个与类别无关的公共因,42,遥感图像分类往往是多光谱,多元变量,服从多元正态分布,分布密度函数写为:,为了简化计算,通常将 取对数进行计算,等效写为:,讨论:(,1,)当各类型出现的先验概率都相等时,,上述判别就称为最大似然法判别准则,(,Maximum Likelihood,),它与马氏距离判别等效,就比较,X,属于各类别,的似然概率的大小从而确定其归属,(,2,)进一步,当各类型的协方差矩阵也相等时,上述判别就成为欧氏距离判别,遥感图像分类往往是多光谱,多元变量,服从多元正态分布,分布密,43,四、有监分类的特点,优点:,1,可根据应用的目的和区域,有选择的决定分类类别,避免出现一些不必要的类别,2,可控制训练样本的选择,3,可通过检查训练样本来决定训练样本是否被精确分类,避免分类中的严重错误,4,避免了非监督分类中对光谱集群的重新归类,缺点:,分类系统的确定、训练样本的选择都有较强的主观性,由于图像中同一类别的光谱差异较大,造成训练样本的代表性下降,训练样本的选择和评估需花费较多的人力、时间,只能识别训练样本中定义的类别,若某类别由于训练者不知道或者其数量太少,未被定义,则监督分类不能识别,四、有监分类的特点,44,第八节 遥感图像计算机分类存在的问题与对策(,Countermeasures,),从前面的分类算法看,这些方法各有特点,可是遥感图像的计算机自动分类仍然,难以消除错,分(,Commission,)和漏分(,Omission,),现象,分类精度一般只有,60-70%,达到,85%,就是较高的分类精度。特别是地物景观变化多样的丘陵山区、人为活动影响,较大的地区,更难获得高精度的分类结果。目前存在的主要问题及相关对策是:,正确选取参加分类的特征变量,(,Selection of Appropriate Features,),参加分类