,*,基于小波多尺度统计特征的图像分类,报告人:翟俊海,1.,小波变换,2.,图像分类问题现状,3.,小波多尺度统计特征抽取及图像分类,4.,实验比较,5.,下一步工作,6.,参考文献,报告内容,1.,小波变换,小波变换是强有力的时频分析,(,处理,),工具,是在克服傅立叶变换缺点的基础上发展而来的。已成功应用于很多领域,如信号处理、图像处理、模式识别等。,小波变换的一个重要性质是它在时域和频域均具有很好的局部化特征,它能够提供目标信号各个频率子段的频率信息。这种信息对于信号分类是非常有用的。,小波变换一个信号为一个小波级数,这样一个信号可由小波系数来刻画。,1.1,一维小波变换(一维多尺度分析),设有,L,2,(,R,),空间的子空间序列:,V,j,的,正交基函数是由一个称为尺度函数的函数,(,x,),经伸缩平移得到的,设,W,j,是,V,j,相对于,V,j,+1,的正交补空间,,W,j,的正交基函数是由一个称为小波函数的函数,(,x,),经伸缩平移得到的,小波函数必须满足以下两个条件的函数:,小波必须是振荡的;,小波的振幅只能在一个很短的一段区间上非零,即是局部化的。如:,图,1,小波例,1,图,2,小波例,2,不是小波的例,图4,图3,构成,V,j,+1,的正交基。,满足下列关系式,(,二尺度方程,),:,信号的多尺度分解:,1.2,二维小波变换(二维多尺度分析),二维小波变换是由一维小波变换扩展而来的,二维尺度函数和二维小波函数可由一维尺度函数和小波函数张量积得到,即:,图像的二维小波变换包括沿行向,(,水平方向,),和列向,(,垂直方向,),滤波和,2-,下采样,如图所示:,图,5,图像滤波采样,说明:如图所示,首先对原图像,I,(,x,y,),沿行向,(,水平方向,),进行滤波和,2-,下采样,得到系数矩阵,I,L,(,x,y,),和,I,H,(,x,y,),,,然后再对,I,L,(,x,y,),和,I,H,(,x,y,),分别沿列向,(,垂直方向,),滤波和,2-,下采样,最后得到一层小波分解的,4,个子图:,I,LL,(,x,y,),I,(,x,y,),的(粗)逼近子图,I,HL,(,x,y,),I,(,x,y,),的水平方向细节子图,I,LH,(,x,y,),I,(,x,y,),的,垂直方向细节子图,I,HH,(,x,y,),I,(,x,y,),的,对角线方向细节子图,二维金字塔分解算法,令,I,(,x,y,),表示大小为,M,N,的原始图像,,l,(,i,),表示相对于分析小波的低通滤波器系数,,i,=0,1,2,N,l,-1,,,N,l,表示滤波器,L,的支撑长度;,h,(,i,),表示相对于分析小波的高通滤波器系数,,i,=0,1,2,N,h,-1,,,N,h,表示滤波器,H,的支撑长度,则,对逼近子图重复此过程,直到确定的分解水平,下图是二层小波分解的示意图。,图,6,图像多尺度分解,,(a),一层分解,,(b),二层分解,2.,图像分类问题现状,目前常用的分类器如支持向量机,神经网络分类器等大多以结构化数据作为输入;,图像数据是非结构化数据,不能直接用于分类;,图像特征提取在图像分类中扮演着非常重要的角色,特征提取的好坏直接影响着分类精度和分类器的性能;,图像的小波变换可用于图像特征提取,实际上,可将小波变换看作一种特征映射;,图像分类就是利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。,图像分类方法可分为,:,图像空间的分类方法,利用图像的灰度、颜色、纹理、形状、位置等底层特征对图像进行分类;,例如:,文献,1,利用灰度直方图特征对图像进行分类;,文献,2,利用纹理特征对图像进行分类,;,文献,3,采用纹理、边缘和颜色直方图混合特征对图像进行分类;,文献,1,、,2,、,3,均采用,SVM,作为分类器。,文献,4,用矩阵表示图像,矩阵元素是相应象素的灰度值,然后用,SVD,和,PCA,方法抽取图像特征,,BP,网络作为分类器。,图像空间的分类方法,的共同缺点是数据量大、计算复杂性高,但分类精度一般比较理想。,特征空间的分类方法,首先将原图像经过某种变换如,K-L,变换、小波变换等变换到特征空间,然后在特征空间提取图像的高层特征以实现图像的分类。,这类分类方法的文献尤以纹理图像分类和遥感图像分类最多。,文献,5,对常见的纹理分类进行了综述,如下表:,文献,特征,分类器,文献,6,Gabor filters,Support vector machine classifier,文献,7,Gabor filters and,Statistical features,Bayesian network classifier,文献,8,Gabor filters,Multiple neural network classifiers,文献,9,Gabor filters and,wavelet transform,Support vector machine classifier,特征空间的分类方法,可降低数据维数,降低计算复杂性,但问题相关性较强,与特征提取的方法和效果有很大关系。,3.,小波多尺度统计特征抽取及图像分类,图像特征提取及分类方法,图像的小波特征提取首先对输入图像做,J,层二维小波分解;,因为小波变换具有很好的时频局部化特性,所以可以将图像的不同底层特征变换为不同的小波系数;,输入图像经过经一层小波分解后,被分成,4,个子图:,LL,1,逼近子图,它代表输入图像水平和垂直两个方向的低频成分;,HL,1,细节子图,它代表输入图像水平方向的高频成分和垂直方向的低频成分;,LH,1,细节子图,它代表输入图像水平方向的低频成分和垂直方向的高频成分;,HH,1,细节子图,,,它代表输入图像水平和垂直方向高频成分。,在逼近子图,LL,1,上重复二维小波分解过程,进行二层小波分解,如此继续分解,得到子图序列,LL,J,,,HL,k,,,LH,k,,,HH,k,(,k,=1,2,J,),。,小波基与分解层次的选取是非常重要的,目前还没有一个统一的标准。,小波基的选取,一般考虑下列因素:,线性相位,:,如果小波具有线性相位或至少具有广义线性相位,则可以避免小波分解和重构时的图像失真,尤其是图像在边缘处的失真;,紧支性和衰减性,:,紧支性和衰减性是小波的重要性质,紧支宽度越窄或衰减越快,小波的局部化特性越好。,计算复杂度越低,便于快速实现;,正交性,:,用正交小波基对图像做多尺度分解,可得一正交的镜像滤波器。低通子带数据和高通子,带数据分别落在相互正交的,L,2,(,R,2,),的子空间中,使个子带数据相关性减少;,其他,分解层次,分解层次一般,2-5,层均可,要视具体应用而定,我们取为,3,,即作,3,层小波分解,共得到,10,个子图,,如图,7,。,特征抽取,每个子图抽取四个特征:,最大的小波系数;,最小的小波系数;,小波系数均值;,小波系数均方差。,这样对于一幅图像,可得到一个,40,维的向量,再加上一个类别属性,最后所得特征向量的维数维,41,维。,均值和方差的计算公式:,NEXT,I(x,y)128,128,I,1,(x,y)64,64,I,1,H,(x,y)64,64,I,1,V,(x,y)64,64,I,1,D,(x,y)64,64,I,2,(x,y)32,32,I,2,H,(x,y)32,32,I,2,V,(x,y)32,32,I,2,D,(x,y)32,32,I,3,(x,y)16,16,I,3,H,(x,y)16,16,I,3,V,(x,y)16,16,I,3,D,(x,y)16,16,I,4,(x,y)8,8,I,4,H,(x,y)8,8,I,4,V,(x,y)8,8,I,4,D,(x,y)8,8,图,7,图像,I(x,y),的多尺度分解,RETURN,4.,实验比较,采用了标准的,Columbia Object Image Library(COIL-20),图像数据库,该数据库共有,20,大类,1440,幅图像,(,如图,8,),,,每类,72,幅图像,每次旋转,5,得到,,,如图,9,所示,,PNG,文件格式。,每次实验从中选取视觉相似度较高的两类图像,在每一类中随机选取,40,幅作为训练集,另,32,幅作为测试集,所以训练集包含,80,幅图像,测试集包含,64,幅图像。,采用,Db4,小波对实验图像做三层小波分解,共有,10,个不同频率字段的子图,每个子图抽取出,4,个特征,这样共有,40,个特征,再加上一维的类别属性,所以特征向量是,41,维的。,SVM,分类器,高斯核函数。,实验结果,列于表,1,。,NEXT,图,8 COIL-20,图像,RETURN,图,9 7,个位置的图像,RETURN,表,1,两种方法的实验结果比较,RETURN,4.,下一步的工作,从,图像小波系数中抽取其它特征,如多尺度熵特征;,小波函数逼近与径向基函数逼近的联系;,完善实验设计。,6.,参考文献,1 Olivier,Chapelle,Patrick,Haffner,and Vladimir N.,Vapnik,.Support Vector Machines for Histogram-Based Image Classification.IEEE TRANSACTIONS ON NEURAL NETWORKS,VOL.10,NO.5,SEPTEMBER 1999.,2,Kwang,In Kim,Keechul,Jung,Se Hyun,and Hang,Joon,Kim,Support Vector Machine for Texture classification,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE,VOL.24,NO.11 NOVEMBER 2002,pp.1542-1550.,3,万华林,,M.U.,Chowdhury,.,基于支持向量机的图像语义分类,.,软机学报,,2003,,,VOL.14 NO.11,PP.1892-1899.,4 R.,Swiniarski,L.Hargis,Rough set as a front end of neural-networks texture classifiers,Neurocomputing,36(1-4)(2001)85102.,5,Chih,-Fong Tsai,Image mining by spectral features:A case study of scenery image classification,Expert Systems with Application 32(2007)135-142.,6,Autio,I.,&,Elomaa,T.(2003).Flexible view recognition for indoor navigation based on Gabor filters and support vector machines.Pattern Recognition,36(12),27692779.,7 Huang,Y.,Chan,K.L.,&Zhang,Z.(2003).Texture classification by multi-model feature integration using Bayesian networks.Pattern Recognition Letters,24,393401.,8,Monadjemi,A.,Thomas,B.T.,&,Mirmehdi,M.(2002).Experiments on high resolution images towards outdoor scene classification.Proceedings of the seventh computer vision wint