07压缩与熵编码.doc

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
07压缩与熵编码

第二篇 压缩与编码 数字信号的压缩与编码是多媒体的核心技术和重要内容。第3章中所讲的,音频信号的自适应编码、差分编码和预测编码等,都是典型的压缩编码。 本篇先介绍压缩的基本概念,再讲解可用于静态图像编码的若干常用熵编码压缩算法、基于DCT的JPEG编码、运动图像和伴音的MPEG编码压缩算法、以及当前十分热门的AVC和AVS编码。 本篇分为如下5章: 第7章 压缩与熵编码 第8章 JPEG编码 第9章 MPEG编码 第10章 H.264/AVC编码 第11章 AVS视频编码 第7章 压缩与熵编码 由于多媒体信号的数据量巨大,为了节省存储空间和传输带宽,需进行压缩编码。多媒体数据的压缩方法,可以分成三大类,其中的熵编码是基础,源编码是重点,而将它们二者相结合的混合编码则是各种编码标准所采用的主要方法。 本章先介绍压缩的基本概念,包括:压缩的需要与可能、算法的特点与分类和一般的编码过程。然后,在了解熵定义的基础上,讨论若干常用的熵编码算法,包括:Shannon-Fano编码、Huffman编码、算术编码、RLE和可用于GIF图像编码的LZW算法。 7.1 压缩概论 领域 概念 动词 名词 计算机 压缩 compress compression 还原(解压缩/重构) decompress decompression 电子与通信 编码 encode encoding / coding 解码(译码) decode decoding 数据压缩(data compression) ,在电子与通信领域也常被称为信号编码(signal coding),包括压缩和还原(或编码和解码)两个步骤,相关概念的英文单词参见表7-1。与压缩相关的学科有:信息论、数学、信号处理、数据压缩、编码理论和方法。 7.1.1 压缩的需要与可能 由于多媒体信号的数据量巨大,所以需要压缩;同时,由于在多媒体数据中,存在着各种冗余,所以可以压缩。 压缩的需要 数据量巨大是多媒体信号的特点,例如: 一幅1024*1024真彩图:1024行 * 1024列 * 3B彩色 = 3MB 5分钟的CD音乐:44100样本 / 秒 * 2B(16b) / 样 * 2声道 * 60秒 * 5分钟 = 50.47MB 90分钟的PAL视频:625行 * 864列 * 3B彩色 * 25帧 / 秒 * 60秒 * 90分 = 203.68GB 为了节省存储空间(如VCD/DVD、JPEG/MP3/MP4、多媒体数据库)和传输带宽(HDTV、因特网、流媒体),以进行实时高质的多媒体通信(如视频/音频点播、网络现场直播、可视电话、视频会议),必须对多媒体数据进行压缩编码。 压缩的可能 多媒体数据和人类感觉存在着各种冗余: 空间冗余:图像的相邻像素相关; 时间冗余:相邻音频样本相关、相邻视频帧相关; 信道冗余:(环绕)立体声的声道之间相关、立体电影/电视的左右视觉信号之间相关; 频率冗余:相邻的频谱值相关,人对高频信号不敏感或分辨率低; 统计冗余:信号中有的字符出现的频率高,可以采用较短的编码;有的有的信号特征有标度不变性或统计自相似性(如纹理和分形等); 结构冗余:多媒体数据存在分布模式,相近的图区可分类(用于矢量量化方法); 听觉冗余:人耳的低音听阈高、强纯音的频率屏蔽、相邻声音的时域屏蔽; 视觉冗余:人眼对亮度变化比对色彩的变化更敏感、对高亮区的量化误差不敏感、视网膜分频道。 7.1.2 压缩算法的特点与分类 用于多媒体数据的压缩方法众多,可按主要特点将它们分成不同的类型。 特点 无损与有损 无损压缩:能够无失真地从压缩后的数据重构,准确地还原原始数据。可用于对数据的准确性要求严格的场合,如可执行文件和普通文件的压缩、磁盘的压缩,也可用于多媒体数据的压缩。该方法的压缩比较小。如差分编码、RLE、Huffman编码、LZW编码、算术编码。 有损压缩:有失真,不能完全准确地恢复原始数据,重构的数据只是原始数据的一个近似。可用于对数据的准确性要求不高的场合,如多媒体数据的压缩。该方法的压缩比较大。例如预测编码、音感编码、分形压缩、小波压缩、JPEG/MPEG 对称性 若编解码算法的复杂性和所需时间差不多,则为对称的编码方法,多数压缩算法都是对称的。但也有不对称的,一般是编码难而解码容易,如Huffman编码与分形编码。但用于密码学的编码方法则相反,是编码容易,而解码则非常非常难。 帧间与帧内 在视频编码中会同时用到帧内与帧间的编码方法,帧内编码是指在一帧图像内独立完成的编码方法,同静态图像的编码,如JPEG;而帧间编码则需要参照前后帧才能进行编解码,并在编码过程中考虑对帧之间的时间冗余的压缩,如MPEG。 实时性 在有些多媒体的应用场合,需要实时处理或传输数据

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档