单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,模式识别,Pattern Recognition,余 莉,电话:,76434,(,O,),61430,(,M,),E-mail,:(民网),(军网),课程对象,信息工程专业本科生的专业课,学院硕士研究生的学位课,学院博士研究生的必修课之一,学习方法,着重理解,基本概念基本方法算法原理,注重理论与实践紧密结合,基本要求,基本:,完成课程学习,通过考试,获得学分。,提高:,能够将所学知识和内容用于课题研究,解决实际问题。,飞跃:,通过模式识别的学习,改进思维方式,为将来的工作打好基础,终身受益。,课程内容及安排,第一章 引论,(2,学时,),第二章 聚类分析,(4,学时,),第三章 判别域代数界面方程法,(4,学时,),第四章 统计判决,(4,学时,),第五章 统计决策中的学习与估计(,4,学时,),第六章 最近邻方法 (,2,学时,),第七章 特征提取与选择,(2,学时,),复习,(2,学时,),实验 上机实验,(8,学时,),作业 每章课后布置习题,考核 笔试,(70%)+,实验,(20%)+,作业,(10%),教材及参考教材,教材,孙即祥,,现代模式识别,,国防科技大学出版社,,2002.1,参考教材,J.P.Marques de Sa,模式识别,-,原理、方法及应用,,清华大学出版社,,2002.11,边肇祺等,,模式识别,(第二版)清华大学出版社,2000.1,Sergios Theodoridis,李晶皎等译,模式识别(第三版),电子工业出版社,,2006,第一章引 论,1.1,模式和模式识别,1.1.1,模式和模式识别的概念,识别是人类的基本行为,模式识别(,Pattern Recognition,),使用计算机来辨别事物。,机器识别,计算机识别,机器自动识别。,1.2,模式识别系统,概 念,样本,(,Sample),:一个具体的研究(客观)对象。如某人写的一个汉字,一幅图片等。,模式,(,Pattern,):对客体(研究对象)特征的描述(定量的或结构的描述),是取自客观世界的某一样本的测量值的集合(或综合)。,模式类,(,Class,):,具有某些共同特性的模式的集合。,特征矢量:,设一个研究对象的 个特征量测量值分别,为,我们将它们作为一个整体来,考虑,让它们构成一个 维特征矢量,。,特征空间,:,各种不同取值的特征矢量的全体构成了,维特征空间。,注:,特征矢量就是特征空间中的一个点。,(,颜色(绿,/,红),似圆度,),颜色(绿,/,红),似圆度,模式识别:,确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。模式分类的过程。,1.1.2,机器与人类识别事物原理的比较,人类:,具有抽象抽象概念的能力,总结规律,抽象出概念,机器:,缺乏抽象能力,基本方法是计算,1.1.3,模式识别技术的应用领域,生物学,自动细胞学、染色体特性研究、遗传研究,天文学,天文望远镜图像分析、自动光谱学,经济学,股票交易预测、企业行为分析,医学,心电图分析、脑电图分析、医学图像分析,文字识别(,Character Recognition,),OCR,(,Optical Character Recognition,),智能交通(,Intelligent Traffic,),车牌、车型,语音识别(,Speech recognition,),翻译机,身份识别等,目标识别,ATR,(,Automaic Target Recognition,),(,1,)确定患者的病症:测量体温、血压,化验血沉,询问临床表现(,模式采集,);,(,2,)医生运用医学知识和个人经验(,分类判决规则,),根据主要病症(,特征提取,/,选择,),作出诊断(,分类判决,):该患者(,模式样本,)患了何种疾病(,模式类,)。,例子,1,:诊断,1.2,模式识别系统,1.2,模式识别系统,数据采集,特征提取,正确率,测试,数据采集,特征提取,改进分类识别规则,二次特征,提取与选择,分类,识别,改进采集,提取方法,二次特征提取与选择,改进特征提取与选择,制定改进分类识别规则,待识,对象,训练,样本,人工,干预,识别结果,例子,2,:苹果和香蕉的分类,颜色(绿,/,红),似圆度,1.2,模式识别系统,18,纸币识别器对纸币按面额进行分类,面额,例子,3,:纸币识别系统,5元,10元,20元,50元,100元,19,长度(,mm),宽度(,mm),5元13663,10元14170,20元14670,50元15170,100元15677,例子,3,:纸币识别系统,20,磁性,金属条位置(大约),5元有 54/82,10元有 54/87,20元有 57/89,50元有 60/91,100元有 63/93,例子,3,:纸币识别系统,21,数据采集、特征提取:,长度、宽度、磁性、磁性的位置等等,特征选择:,长度、位置,分类识别:,确定纸币的面额,例子,3,:纸币识别系统,各类空间(,Space),的概念,对象空间,模式空间,特征空间,类型空间,模式采集:从客观世界(对象空间)到模式空间的过程称为模式采集。,特征提取和特征选择:由模式空间到特征空间的变换和选择。,类型判别:特征空间到类型空间所作的操作。,1.3,特征矢量和特征空间,所有样本观测数据构成的空间,1.3,特征矢量和特征空间,1.4,模式识别方法,统计判决,句法结构,模糊判决,逻辑推理,神经网络,(,1,)统计判决,理论基础:概率论,数理统计,模式描述方法:特征向量,主要方法几何分类:线性分类,非线性分类统计分类:,Bayes,决策无教师的分类:聚类分析,主要优点,1,)比较成熟,2,)能考虑干扰噪声等影响,3,)识别模式基元能力强,主要缺点,1,)对结构复杂的模式抽取特征困难,2,)不能反映模式的结构特征,难以描述模式的性质,3,)难以从整体角度考虑识别问题,(,2,)句法结构,理论基础:形式语言,自动机技术,模式描述方法:符号串,树,图,模式判定:是一种语言,用一个文法表示一个类,,m,类就有,m,个文法,然后判定未知模式遵循哪一个文法。,主要优点,1,)识别方便,可以从简单的基元开始,由简至繁。,2,)能反映模式的结构特征,能描述模式的性质。,3,)对图象畸变的抗干扰能力较强。,主要缺点当存在干扰及噪声时,抽取特征基元困难,且易失误。,(,3,),模糊判决,理论基础:模糊数学,模式描述方法:模糊集合,A=(,a,a),(,b,b),.(,n,n),模式判定:是一种集合运算。用隶属度将模糊集合划分为若干子集,,m,类就有,m,个子集,然后根据择近原则分类。,主要优点由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体的与主体的特征,从而允许样本有相当程度的干扰与畸变。,主要缺点准确合理的隶属度函数往往难以建立,故限制了它的应用。,(,4,),逻辑推理,理论基础:演绎逻辑,布尔代数,模式描述方法:字符串表示的事实,模式判定:是一种布尔运算。从事实出发运用一系列规则,推理得到不同结果,,m,个类就有,m,个结果。,主要优点已建立了关于知识表示及组织,目标搜索及匹配的完整体系。对需要众多规则的推理达到识别目标确认的问题,有很好的效果。,缺点当样本有缺损,背景不清晰,规则不明确甚至有歧义时,效果不好。,(,5,),神经网络,理论基础:神经生理学,心理学,模式描述方法:以不同活跃度表示的输入节点集,模式判定:是一个非线性动态系统。通过对样本的学习建立记忆,然后将未知模式判决为其最接近的记忆。,主要优点可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样本有较大的缺损、畸变。,主要缺点模型在不断丰富与完善中,目前能识别的模式类还不够多。,