资源预览内容
第1页 / 共34页
第2页 / 共34页
第3页 / 共34页
第4页 / 共34页
第5页 / 共34页
第6页 / 共34页
第7页 / 共34页
第8页 / 共34页
第9页 / 共34页
第10页 / 共34页
第11页 / 共34页
第12页 / 共34页
第13页 / 共34页
第14页 / 共34页
第15页 / 共34页
第16页 / 共34页
第17页 / 共34页
第18页 / 共34页
第19页 / 共34页
第20页 / 共34页
亲,该文档总共34页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,多媒体压缩技术,第,7,章,7.1,多媒体数据压缩基础知识,数据压缩的必要性,数据压缩的可能性,数据压缩基本原理,7.2,数据压缩编码算法,统计编码,预测编码,变换编码,7.3,常见多媒体数据压缩标准,音频压缩标准,静态图像压缩标准,运动图像和视频压缩标准,多媒体压缩技术第 7 章7.1 多媒体数据压缩基础知识,1,教学重点:,教学目标:,了解媒体数据压缩基础知识,包括数据压缩的必要性、数据压缩的可能性、数据压缩基本原理;了解数据压缩的编码算法,包括统计编码、预测编码、变换编码;了解常见多媒体数据压缩标准,包括音频压缩标准、静态图像压缩标准、运动图像和视频压缩标准等。,了解多媒体数据压缩的必要性、多媒体数据压缩的可能性、数据压缩方法的分类,。,教学进程,多媒体压缩技术,第,7,章,教学重点:教学目标:了解媒体数据压缩基础知识,包括数,2,7.1 多媒体数据压缩基础知识,7.1.1,数据压缩的必要性,随着多媒体技术的发展,多媒体数据的传输和存储过程日益频繁。未经处理的多媒体数据数据量巨大,使数据在存储、传输和处理等过程中有诸多不便,因此,多媒体数据的压缩是多媒体应用中的关键问题之一。,教学进程,7.1 多媒体数据压缩基础知识 7.1.1 数据压缩的必要性,3,教学进程,一幅具有,800,600,分辨率的真彩色图像,(24,位,/,像素,),,它的数据量,为:,800,600,24=10.98Mb=,1.37MB,7.1 多媒体数据压缩基础知识,7.1.1,数据压缩的必要性,B,G,R,相当于,72万,汉字在计算机中存储的数据量!,教学进程一幅具有800600分辨率的真彩色图像(24位/,4,教学进程,视频数据按我国使用的,PAL,制式,要达到每秒,25,帧的全动态显示要求。若每帧显示分辨率为,640,480,的真彩色图像(,24,位,/,像素),则每秒所需的数据量为,7.1 多媒体数据压缩基础知识,7.1.1,数据压缩的必要性,650MB的CD-ROM光盘只能存放,29.6秒,的视频!,6404802425=175.8Mb=,21.97MB,教学进程视频数据按我国使用的PAL制式,要达到每秒25帧的,5,教学进程,7.1 多媒体数据压缩基础知识,7.1.1,数据压缩的必要性,1,分钟高保真立体声数字音频的数据量为:,(,44100,16,2,),60/8=10.09MB,一首歌曲的播放时间大概是,4,分钟,也就是说,一首歌曲文件的大小是40MB左右,若保存在一个容量为512MB的U盘中,只能存储,12首,这样的歌曲。,巨大的多媒体数据量对于数据的存储和传输带来了很大的困难,因此,多媒体数据必须被压缩!,教学进程7.1 多媒体数据压缩基础知识 7.1.1 数据压缩,6,教学进程,多媒体数据的数据量是非常巨大的,但这些数据量表示的信息量并不等于数据量本身的大小,也就是说,多媒体数据中存在着数据冗余。应用某种编码方法提取或减少这些数据冗余,便可以达到压缩数据的目的,这就是多媒体数据可以压缩的原因。,7.1 多媒体数据压缩基础知识,7.1.2,数据压缩的可能性,可用公式表示如下:,du=D-I,其中,D是指数据量,I指信息量,du指的是冗余量。,教学进程多媒体数据的数据量是非常巨大的,但这些数据量表示的信,7,教学进程,例如:,180个汉字,在计算机中存储的数据量为1802B=360B,7.1 多媒体数据压缩基础知识,7.1.2,数据压缩的可能性,广播员朗读这些内容1分钟,数字化时采样频率8000Hz,单声道,8位量化,则数据量为(8000 8 1)60/8480000B。可见,传递同样信息,音频数据中则存在冗余。,教学进程例如:7.1 多媒体数据压缩基础知识 7.1.2 数,8,教学进程,空间冗余,:数字化图像中某个区域的颜色、亮度、饱和度等相同,则该区域里的像素点数据也是相同的,我们只需记下一个像素点的数据及其他像素点的位置,就可以得到该区域的所有信息,大量的重复像素数据就形成了空间冗余。,7.1 多媒体数据压缩基础知识,7.1.2,数据压缩的可能性,数据冗余类型,空间冗余常存在图像数据中,教学进程空间冗余:数字化图像中某个区域的颜色、亮度、饱和度,9,教学进程,时间冗余经常存在于视频和音频数据中。视频是由位于时间轴上的一组连续的帧构成的,相邻帧之间具有很强的时间相关性,且往往变化不大,后一帧的数据与前一帧的数据有许多相同之处,这样就形成了时间冗余。,7.1 多媒体数据压缩基础知识,7.1.2,数据压缩的可能性,教学进程时间冗余经常存在于视频和音频数据中。视频是由位于时,10,教学进程,视(听)觉冗余:,人类的视觉和听觉系统由于受到生理特征的限制,对于图像和声音信号的一些细微变化是感觉不到的,忽略这些变化后,信号仍然被认为是完好的。我们把这些超出人类视(听)觉范围的数据称为视(听)觉冗余。,7.1 多媒体数据压缩基础知识,7.1.2,数据压缩的可能性,教学进程视(听)觉冗余:人类的视觉和听觉系统由于受到生理特,11,教学进程,7.1 多媒体数据压缩基础知识,7.1.2,数据压缩的可能性,知识冗余:,图像的记录方式与某些知识有着定的相关性,例如,人脸的图像就有固定的结构,鼻子位于中间,上方是眼睛,下方是嘴等。这类规律性的结构可由先验知识和背景知识得到,但计算机并不具备这些知识,只是一个像素一个像素地存人数据,这就形成了知识冗余。,教学进程7.1 多媒体数据压缩基础知识 7.1.2 数据压缩,12,教学进程,7.1 多媒体数据压缩基础知识,7.1.2,数据压缩的可能性,结构冗余:,在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等。我们称这种冗余为结构冗余。若已知分布模式,可通过某一过程产生图像。,教学进程7.1 多媒体数据压缩基础知识 7.1.2 数据压缩,13,教学进程,数据压缩本质,数据的压缩实际上是一种编码过程,即根据原始数据的内在联系将数据从一种编码映射为另一种编码,以减少表示信息所需要的总位数。,7.1 多媒体数据压缩基础知识,7.1.3,数据压缩基本原理,数据压缩过程,教学进程 数据压缩本质 数据的压缩实际上是一种编码过程,,14,教学进程,数据压缩方法分类,无损编码,用无损编码压缩的数据是可以完全恢复的,解码后的数据与原始数据完全一致,故也称无失真编码或可逆编码。,有损编码,有损编码又称为有失真编码,即在编码过程中要丢失一些人的视,/,听觉不敏感的信息,且丢失的信息不可恢复。,7.1 多媒体数据压缩基础知识,7.1.3,数据压缩基本原理,混合编码,混合编码是指同时使用两种或两种以上的编码方法进行组合编码的方法。,教学进程 数据压缩方法分类 无损编码 用无损编码压缩的,15,教学进程,7.1 多媒体数据压缩基础知识,7.1.3,数据压缩基本原理,教学进程7.1 多媒体数据压缩基础知识 7.1.3 数据压缩,16,教学进程,数据压缩方法的衡量指标,压缩率,压缩质量,压缩/解压缩速度,7.1 多媒体数据压缩基础知识,7.1.3,数据压缩基本原理,教学进程 数据压缩方法的衡量指标 压缩率7.1 多媒体数,17,教学进程,统计编码属于无损编码,它是根据信息出现的概率分布规律来进行压缩编码。其方法是:找到消息和码字之间的对应关系,以便恢复时能够准确无误地将原数据再现出来。常用的统计编码包括行程编码、哈夫曼编码和算术编码三种。,行程编码,行程编码又称为游程编码,其编码原理是将具有相同值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。,例如:要编码的字符串为“,aabbbcddddd,”,编码后为“,2a3b1c5d,”,压缩前字符个数为,11,个,压缩后字符个数为,8,个,压缩率为,11,:,8,。,行程编码简单直观,编码/解码速度快,因此许多图形和视频文件,如BMP、TIFF及AVI文件均采用这种方法压缩。,7.2 数据压缩编码算法,7.2.1,统计编码,教学进程统计编码属于无损编码,它是根据信息出现的概率分布规,18,教学进程,哈夫曼编码原理,其基本思想是:对于给定的数据串,先计算其每个字符的出现频率,并得到频率表,运用哈夫曼算法按出现频率由高到低分配编码位数,然后给出一个最优的编码。一般而言,字符出现的频率越高对应的编码越短,出现频率越低对应的编码越长。,7.2 数据压缩编码算法,7.2.1,统计编码,教学进程哈夫曼编码原理其基本思想是:对于给定的数据串,先,19,教学进程,哈夫曼编码过程,(1)初始化,统计各字符出现的概率,根据概率的大小给字符排序。,把 (2)两个概率最小的字符的概率加起来,形成一个新的概率。,(3)把这个新的概率看成是一个新字符的概率,并与其他字符概率重新排序。,(4)重复步骤(1)(3)到最后概率等于1为止。,(5)编码方法:每次合并概率的时候,把即将合并的两个概率分别赋值为0和1:可以给大的概率赋值为0,小的复制为1;也可以给大的概率赋值为1,小的赋值为0。但前后赋值必须统一。,(6)概率,1,到信源字符之间的路径的赋值编码就是哈夫曼编码的码字。,7.2 数据压缩编码算法,7.2.1,统计编码,教学进程哈夫曼编码过程 (1)初始化,统计各字符,20,教学进程,哈夫曼编码实例,7.2 数据压缩编码算法,7.2.1,统计编码,待编码字符:,教学进程哈夫曼编码实例7.2 数据压缩编码算法 7.2.1,21,教学进程,哈夫曼编码实例,7.2 数据压缩编码算法,7.2.1,统计编码,编码过程:,7.2 数据压缩编码算法,7.2 数据压缩编码算法,教学进程哈夫曼编码实例7.2 数据压缩编码算法 7.2.1,22,教学进程,哈夫曼编码实例,7.2 数据压缩编码算法,7.2.1,统计编码,编码结果:,编码以后的信源字符串的平均码长为:20.3+40.08+40.11+10.37+30.14=2.15(位)。而采用等长码长对5个字符进行编码需要的码长是3位。,教学进程哈夫曼编码实例7.2 数据压缩编码算法 7.2.1,23,教学进程,7.2 数据压缩编码算法,7.2.1,统计编码,算术编码原理,其基本思想是:把整个信源字符串看作是一个集合,它把集合表示为实数线上的0到1之间的一个区间。这个集合中的每个元素都要用来缩短这个区间。信源集合的元素越多,所得到的区间就越小,当区间变小时,就需要更多的数位来表示这个区间,这就是区间作为代码的原理。,新老区间的边界计算公式如下:,新区间起始位置(,Ns,),=,前区间起始位置(,Fs,),+,当前区间左端(,Cl,)前区间长度(,L,),新区间结束位置(,Ne,),=,前区间起始位置(,Fs,),+,当前区间右端(,Nr,)前区间长度(,L,),新区间长度(L)=新区间结束位置(Ne)-新区间起始位置(Ns),教学进程7.2 数据压缩编码算法 7.2.1 统计编码算术,24,教学进程,7.2 数据压缩编码算法,7.2.1,统计编码,算术编码实例,待编码字符为:X1X3X4X2,其字符出现的概率和初始区间为:,教学进程7.2 数据压缩编码算法 7.2.1 统计编码算术,25,教学进程,消息,X1 X3 X4 X2,可以转化为范围,0.0646,,,0.067,中的任意一个数值,用一个数值代表了一个字符串,达到了数据压缩的目的,7.2 数据压缩编码算法,7.2.1,统计编码,教学进程消息X1 X3 X4 X2可以转化为范围0.06,26,教学进程,预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。,差分脉冲编码调制,自适应差分脉冲编码调制,7.2 数据压缩编码算法,7.2.2,预测编码,教学进程预测编码是根据离散信号之间存在着一定关联性的特
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6