资源预览内容
第1页 / 共45页
第2页 / 共45页
第3页 / 共45页
第4页 / 共45页
第5页 / 共45页
第6页 / 共45页
第7页 / 共45页
第8页 / 共45页
第9页 / 共45页
第10页 / 共45页
第11页 / 共45页
第12页 / 共45页
第13页 / 共45页
第14页 / 共45页
第15页 / 共45页
第16页 / 共45页
第17页 / 共45页
第18页 / 共45页
第19页 / 共45页
第20页 / 共45页
亲,该文档总共45页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第4章语音信号的时域分析,4.2语音信号的数字化与预处理,4.1概述,4.4短时平均过零率和上升过零间隔,4.3短时平均能量和短时平均幅度,4.5短时自相关函数和短时平均幅度差函数,4.6短时时域处理技术的应用,4.7中值滤波在语音短时时域处理中的应用,第4章语音信号的时域分析4.2语音信号的数字化与预处理,1,第4章语音信号的时域分析,4.1,概述,语音信号,携带各种信息:,男声,、,女声,,,喜,、,怒,,,中,、,英,等。,不同场合感兴趣的信息不同;,判断信号是否为,语音,,只需人类语音信号的,一般特征,;,区分语音为,清、浊音,,需语音,能量谱,和,基频,;,数字传输或数字存储时,目的,不同,,保留信息精度,不同,;,语音信号处理,的,任务,:,去除,与应用目的不相干或影响不大的语音信息,需要的信息不仅应当提取出来,有时还需要,加强,。,以上涉及语音信号中,各种信息的,表示问题,。,表示方法的原则:,最方便,、,最有效,。,短时分析,技术,贯穿于,语音分析的全过程。,第4章,语音信号的时域分析,4.1,概述,同济大学电子与信息工程学院 -,2,-赵晓群,教授,第4章语音信号的时域分析第4章语音信号的时域分析,2,整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。,语音信号分析,:,时域分析,、,频域分析,、,倒频域分析,等;,语音信号分析,:,模型分析,、,非模型分析,;,模型分析法是指依据语音信号产生的数学模型,来分析和提取表征这些模型的,特征参数,,,模型分析:,共振峰分析,、,无损级联声管分析法,非模型分析:,不进行模型化的分析,语音的预处理,:语音信号的,数字化,、语音信号的,端点检测,、,预加重,、,加窗,、,分帧,等,,本章重点:,语音信号的各种时域分析技术,是语音处理技术,的基础知识。,第4章,语音信号的时域分析,4.1,概述,同济大学电子与信息工程学院 -,3,-赵晓群,教授,整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数,3,第4章语音信号的时域分析,4.2,语音信号的数字化和预处理,信号数字化:,放大,、,增益控制,、,反混叠滤波,、,取样,、,A/D,变换,及,编码,(,PCM,编码,);,预处理:,预加重,、,加窗,、,分帧,、,端点检测,等;,图4.1:,语音信号数字,分析,或,处理,的,系统框图,。,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,同济大学电子与信息工程学院 -,4,-赵晓群,教授,图4.1语音信号数字处理系统框图,反混叠滤波,语音输入,语音输出,A/D转换,分析处理,平滑滤波,D/A转换,合成处理,传输或存储,第4章语音信号的时域分析第4章语音信号的时域分析,4,4.2.1,预滤波、取样、A/D变换,预滤波:,带通滤波器,(上、下,截止频率,为,f,H,、,f,L,),防混叠滤波,,抑制,f,s,/2,的输入信号分量(,f,s,为取样频率),抑制工频干扰,(,50,Hz,电源)。,多数,语音编/译码器:,f,H,=3.4,kHz,,,f,L,=60100,Hz,,,f,s,=8,kHz,。,语音识别:,对,电话用户,指标与语音编/译码器时相同;,要求较高或很高:,f,H,=4.5 or 8,kHz,f,L,=60,Hz,f,s,=,10 or 20,kHz,。,A/D,变换需对信号,量化,,编码为,二进制,,产生,量化误差,。,量化误差,(,量化噪声,):,量化信号值,与,原信号值,之差;,信号波形的变化,足够大,或量化,间隔足够小,时,,量化噪声符合具有下列特征的统计模型:,量化噪声是,平稳的白噪声,过程;,量化噪声与输入信号,不相关,;,量化噪声在量化间隔内,均匀分布,,即具有,等概率密度分布,。,同济大学电子与信息工程学院 -,5,-赵晓群,教授,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,4.2.1预滤波、取样、A/D变换 同济大学电子,5,量化信噪比,SNR,(信号与量化噪声的功率比)为:,式中,输入,语音信号序列,的,方差,,,噪声序列,的,方差,,,信号的,峰-峰值,,,B,量化字长,,,设语音信号的幅度服从,Laplace,分布,,则,取 ,上式改写为:,B,=7,bit,,,SNR,=35,dB,,能,满足一般,通信系统的要求。,语音波形的,动态范围,达,55,dB,,故,B,应取,10,bit,以上。,为保持,35,dB,的,信噪比,,常用,12,bit,量化,,附加的5,bit,用于,补偿,30,dB,左右的输入,动态,的变化。,同济大学电子与信息工程学院 -,6,-赵晓群,教授,表明量化器中每,bit,字长对,SNR,的贡献约为,6,dB,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,量化信噪比SNR(信号与量化噪声的功率比)为:同济大学电子与,6,A/D,变换器:,分为,线性,和,非线性,两类。,目前采用绝大部分的,线性,A/D,变换器,是12,bit,。,非线性,A/D,变换器,一般是,8,bit,,它与,12,bit,线性变换器,等效,。,有时需要将非线性的,8,bit,码转换为线性的,12,bit,码。,数字化的,反过程,是从数字化语音中,重构语音,波形。,必须在,D/A,后加,平滑滤波器,,对重构的语音波形的高次谐波起平滑作用,以,去除高次谐波,失真。,预滤波,、,取样,、,A/D,和,D/A,变换,、,平滑滤波,等许多功能可以用,一块芯片,完成,在市场上有多种这样的,集成芯片,供选用。,同济大学电子与信息工程学院 -,7,-赵晓群,教授,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,A/D变换器:分为线性和非线性两类。同济大学电子与信息工程学,7,4.2.2,预处理,预处理:,预加重,、,加窗,、,分帧,、,端点检测,等;,语音的一个特征:,约,8,kHz,高频端按,-6,dB,/,倍频程,跌落。,预加重:,提升,语音的,高频,部分,使信号的频谱变得,平坦,,,可在,反混叠滤波前,,可,压缩动态范围,,,提高信噪比,。,也可在,数字化后,、,参数分析之前,。,预加重,用,6,dB,/倍频程,的提升高频特性的,预加重数字滤波器,:,式中,,为,常系数,,值接近于1,通常取,=0.920.94,。,恢复,原信号,对测量值进行,去加重,处理,,即加上-6 dB/倍频程的下降的频率特性来还原成原来的特性。,同济大学电子与信息工程学院 -,8,-赵晓群,教授,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,4.2.2预处理 同济大学电子与信息工程学院,8,4.2.3,窗函数的作用,采用,连续分段,或,交叠分段,的方法,分帧,,,33 100,帧/秒,。,图4.2,:,帧移与帧长示例。,帧与帧之间的信号平滑过渡,保持其连续性。,帧移:,前后帧的,交叠部分,。,帧移,与,帧长,的,比值,一般为,01/2,。,移动窗函数加权实现:,x,(,n,),为,语音信号,,w,(,n,),为,窗函数,,s,w,(,n,),为,窗选语音信号,。,同济大学电子与信息工程学院 -,9,-赵晓群,教授,图4.2帧移与帧长的示例(,N,为帧长,,M,为帧移),理想窗函数的频率响应有一个,很窄的主瓣,,它增加了频率的分辨度,而,没有旁瓣,。,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,4.2.3窗函数的作用 同济大学电子与信息工程学,9,讨论,窗函数,的,形状,和,长度,的影响。,1.窗函数的形状,好的窗函数的,标准,:,时域:减小,时间窗两端的,坡度,,使窗口两端边缘,平滑过渡到到零,,,减小,语音帧的,截断效应,;,频域:较宽,的3 dB带宽和,较小,的边带最大值。,常用的,窗函数,(窗长为,N,):,(1)矩形(rectangular)窗:,(2)Hamming(汉明)窗:,(3)Hanning(汉宁)窗:,同济大学电子与信息工程学院 -,10,-赵晓群,教授,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,讨论窗函数的形状和长度的影响。同济大学电子与信息工,10,(4)Bartlett(巴特雷特)窗:,(5)Blackman(布累克曼)窗:,(6)Kaiser(凯散)窗:,式中,,零阶贝塞尔函数,,,同济大学电子与信息工程学院 -,11,-赵晓群,教授,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,同济大学电子与信息工程学院 -11,11,图4.3、4.4:,窗函数的波形,矩形窗,主瓣最窄,,频率分辨度,最高,,频率,泄漏最大,;,Blackman,窗频率分辨度,最低,,,频率,泄漏最小,。,常用,矩形窗,、,Hamming,窗,。,同济大学电子与信息工程学院 -,12,-赵晓群,教授,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,图4.3各种窗函数的时间波形,图4.4各种窗的频率响应,Bartlett窗,矩形窗,Hamming窗,Blackman窗,Hanning窗,Kaiser窗,图4.3、4.4:窗函数的波形同济大学电子与信息工程学院,12,2.窗口的长度,取样周期,T,s,=,f,s,、,窗口长度,N,、,频率分辨率,f,的关系为:,T,s,一定时,,f,随窗口,N,增加,而,减小,,,即,f,提高,,时间分辨率,降低,。,如果窗口,取短,,频率分辨率,下降,,时间分辨率,提高,。,取样周期和频率分辨率,矛盾,,应根据需要,选择合适,的窗长。,时域分析:,N,很大,语音高频受阻,短时能量变化很小,不能反映幅度变化;,N,太小,滤波器通带宽,短时能量急剧变化,不能平滑能量函数。,通常一帧内应含有,1 7,个基音周期。,基音周期变化大,从女性和儿童的,2,ms,到老年男子的,14,ms,10,kHz,取样时,,N,折衷选择为,100 200,点(,10 20,ms,)。,分析条件:,(通常需标明,以提供性能评价参考依据),取样频率、精度、预加重方式、窗函数、帧长、帧移,等。,同济大学电子与信息工程学院 -,13,-赵晓群,教授,第4章,语音信号的时域分析,4.2,语音信号的数字化和预处理,2.窗口的长度 同济大学电子与信息工程学院,13,第4章语音信号的时域分析,4.3,短时能量和短时平均幅度,4.3.1,短时能量,语音的清音能量,较小,,浊音能量,较大,。,语音的能量分析主要,短时能量,和,短时平均幅度,。,n,时刻,语音信号的,短时能量,E,n,为:,或,式中,,h,(,n,),=w,2,(,n,),,可以看做滤波器的,冲激响应函数,。,E,n,反映语音,振幅,或,能量,随,时间,缓慢变化的,规律,。,窗函数,或,滤波器,的函数,形式,和,宽度,对能量序列影响很大。,选择合适的,窗函数,或滤波器的,冲激响应函数,和它们的,宽度,。,用得较多的是,矩形窗,和,Hamming,窗,。,第4章,语音信号的时域分析,4.3,短时能量和短时平均幅度,同济大学电子与信息工程学院 -,14,-赵晓群,教授,第4章语音信号的时域分析第4章语音信号的时域分析,14,窗宽的影响:,窗函数很宽,或,冲激响应很长,,平滑作用,显著,,使,E,n,变化不大,反映不出语音能量的时变特性。,窗函数过窄,,平滑作用,有限,,仍然保留,瞬时,快变化,使,E,n,反映语音振幅细节,表现不出振幅平方包络的变化规律。,当,N,小于语音基音周期时,将按照基音周期内语音振幅平方波形的,细节,瞬时变化;,当,N,比基音周期的若干倍还要大时,各段语音的短时能量差别不大,不能跟随语音能量的时变特性。,这两种情况都不能准确描述语音能量自身的实际变化规律。,必须选择合适的窗宽,,兼顾男声和女声,,10,kHz,取样时,选,窗宽,10 20,ms,。,第4章,语音信号的时域分析,4.3,短时能量和短时平均幅度,同济大学电子与信息工
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6