- 1、本文档共118页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ch4-多媒体数据压缩编码技术ppt课件
多媒体技术基础 申煜湘 湖南大学软件学院 rj_syx@hnu.cn 2011.03.27 第四章 多媒体数据压缩编码技术 第四章的内容 多媒体数据压缩编码概述 重要性、可能性、分类 脉冲编码调制PCM 统计编码:Huffman编码、算术编码 预测编码:DPCM、ADPCM、帧间预测 变换编码 多媒体数据压缩编码的国际标准 JPEG、MPEG 第一节 数据压缩编码概述 1.1 多媒体数据压缩编码的重要性 1.2 多媒体数据压缩编码的可能性 1.3 多媒体数据压缩编码的分类 1.1 数据压缩编码的重要性 在多媒体技术中,处理的多媒体数据都应是数字信号,传统的媒体信息需要进行采样和量化后方能在计算机中处理。 原始媒体信息数字化后的数据量巨大。 例1:一页B5(180×255mm)大小的文件,以中等分辨率300dpi、8位色方式扫描,其数据量为6.61MB。 保存一部《鹿鼎记 》(1813页)需要11983.93M(650M的CD得刻19张)。 例2:立体声的激光唱盘,采样频率为44.1kHz,量化位数为16,则一秒钟的音频数据量就可达172KB。 650M的CD只可存储1小时音乐。 对于视频,数据量的问题则更加突出。 例3:采用PAL制式,采样格式为4:4:4,24位色,则一秒钟的视频数据量就可达31.3MB。 电影《龙骑士》(时长100分钟)需要约289张650M的CD存放。 由于多媒体信息的数据量十分庞大,给存储器的存储容量、通信线路的带宽资源、传输速率以及计算机的处理速度都增加了极大压力。 解决方法: 从硬件设备入手:增加存储器、带宽资源;研究新型线缆提高传输效率;使用快速的高档计算机…… 从信息内容入手:进行数据压缩编码。 数据压缩对多媒体应用的意义 通过数据压缩技术可减少多媒体信息的数据量,其意义在于: 1.2 数据压缩编码的可能性 多媒体数据能否进行压缩? 研究表明,多媒体信息中存在大量的冗余,去掉这些冗余数据便可实现数据的压缩。 此图公式 音频中的冗余 音频中的冗余信息主要有: 时域冗余 幅度的非均匀分布;样本间的相关性;周期之间的相关性;基音之间的相关性;静止系数(间隔);长时自相关函数。 频域冗余 非均匀的长时功率谱密度;语音特有的短时功率谱密度。 人耳的听感觉分辨能力有限。 图像/视频中的冗余 图像/视频信息中包含有大量的冗余,主要有下列不同类型的冗余信息: 空间冗余 时间冗余 结构冗余 知识冗余 视觉冗余 图像区域的相同性冗余 纹理的统计冗余 a. 空间冗余 空间冗余是静态图像中最主要的一种冗余。 通常的图像都描述了某个场景,其相邻像素点之间存在一定的空间连贯性。如果编码时不考虑这一相关性,就会造成空间冗余。 b. 时间冗余 时间冗余是视频中常见的一种冗余。 序列图像中,相邻帧往往包含有相同的背景和运动物体,只是运动物体的位置有所变化,因此相邻两帧的数据差别很小,具有时间上的连贯性。如果编码时不考虑这一相关性,就会造成时间冗余。 c. 结构冗余 有些图像中有规则纹理,其像素值存在明显的分布模式, 只要知道分布模式,便可通过某种方法生成图像,这种数据冗余即结构冗余。 d. 知识冗余 对图像的理解有时与某些知识有相当大的相关性,例如人脸的图像就具有同样的五官位置。 可以根据已有的知识构造基本模型,并创建特征图像库,则只需提供少量的特征参数信息便可生成图像,这种数据冗余即知识冗余。 e. 视觉冗余 视觉冗余是针对人眼的视觉特性而言的。 人对图像的敏感性是非均匀、非线性的,而一般的编码却是线性方式,因此存在视觉冗余。 视觉系统对亮度比对色度敏感。 视觉系统对低频信号比对高频信号敏感。 视觉系统对静止图像比对运动图像敏感。 视觉系统对水平、垂直线条比对斜线条敏感。 随着亮度的增加,视觉系统对量化误差的敏感度降低。(高光区可用较少的量化位数) 视觉系统把图像的边缘和非边缘区域分开处理。 视觉系统总是把视网膜上的图像分解成若干个空间有向的频率通道后,再做进一步处理。 f. 图像区域的相同性冗余 有的图像存在一些相同或相近的区域,从而产生数据的重复性存储,这就是图像区域的相同性冗余。 可以只记录一个区域中各个像素的值,与其相同或相近的区域则不必记录。 向量量化方法就是针对这种冗余进行数据压缩的。 g. 纹理的统计冗余 有些纹理并不严格服从某一分布规律,但它在统计意义上又符合该规律,这种数据冗余即纹理的统计冗余。 1.3 数据压缩编码的分类 多媒体数据压缩编码方法有很多种,根据不同的依据可产生不同的分类: 按照编码算法的原理:分成脉冲编码调制、预测编码、变换编码、量化与向量量化编码、统计编码、子带编码、结构编码、模型编码、混合编码等等; 根据质量有无失真:分成有损失编码和无损失编码; 按照其作用域在空间或频
文档评论(0)