多媒体技术原理及应用(马华东第二版)3第三章.ppt

多媒体技术原理及应用(马华东第二版)3第三章.ppt

  1. 1、本文档共115页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体技术原理及应用(马华东第二版)3第三章

第三章 多媒体数据编码标准 静态图像编码标准JPEG 运动图像编码标准MPEG 视听通信编码解码标准H.26X AVS标准 声音压缩标准 3.1 JPEG标准 3.1.1 JPEG标准主要内容 ISO/IEC 10918号标准“多灰度连续色调静态图象压缩编码”即JPEG标准, 选定ADCT作为静态图象压缩的标准化算法。 该标准为保证通用性,包含以下两种方式: 空间方式 可逆编码 空间方式对于基本系统和扩展系统来说,被称为独立功能。 DCT方式 非可逆编码, 包含基本系统(必须保证的功能)和扩展系统(扩充功能) 基本系统是实现DCT编码与解码所需的最小功能集, 大多数的应用系统只要用此标准, 就能基本上满足要求。 扩展系统是为了满足更为广阔领域的应用要求而设置的。 基于DPCM的无失真编码优点是硬件易实现,重建图象质量好。 缺点是压缩比太低, 大约为2:1。 工作原理是对X的预测值X’,将X-X’进行无失真熵编码。对X’的求法见图给出的预测方式。 2. 基于DCT的有失真压缩编码 离散余弦变换 量化处理 DC系数的编码和AC系数的行程编码 熵编码 基于DCT编码过程 解码过程 离散余弦变换 (1)首先把原始图象顺序分割成8×8子块; (2)采样精度为P位(二进制), 把[0, 2P-1]范围的无符号数变换成[-2P-1,2P-1]范围的有符号数, 作为离散余弦正变换(FDCT)的输入; (3)在输出端经离散余弦逆变换(IDCT)后又得到一系列8×8子块, 需将数值范围[-2P-1,2P-1]变换回[0, 2P-1]来重构图象。 这里用的8×8 FDCT的数学定义为: F(u, v)=(1/4)C(u) C(v) [∑x=07∑y=07 f(x,y)· cos((2x+1)u?/16)·cos((2y+1)v?/16)]? 8×8 IDCT的数学定义为:? f(x, y)= (1/4)[∑u=07∑v=07 C(u)C(v)F(u,v)· cos((2x+1)u?/16)·cos((2y+1)v?/16)]? 其中:C(u), C(v)= 1/√2 当u, v=0 C(u), C(v)=1 其它 下面的编码针对FDCT输出的64个基信号的幅值(F(0,0),…,F(7,7)称作DCT系数)来进行 量化处理 量化是一个“多到一”的过程,失真原因 关键是找最小量化失真的量化器, JPEG采用线性均匀量化器,定义为对64个DCT系数除以量化步长, 然后四舍五入取整: FQ(u, v)=Integer Round[F(u, v)/Q(u, v)] Q(u,v)是量化器步长,它是量化表的元素。量化表元素随DCT系数的位置和彩色分量不同有不同的值,量化表尺寸为8×8与64个变换系数一一对应。 这个量化表应由用户规定(JPEG给出参考值-见表2.2,2.3), 并作为编码器的一个输入。 量化的作用: 在一定主观保真度图象质量前提下,丢掉那些对视觉影响不大的信息,通过量化可调节数据压缩比。 DC系数的编码 64个变换系数经量化后, 坐标u=v=0的F(0, 0)称DC系数(直流分量), 它即64个空域图象采样值的平均值。 相邻8×8块之间DC系数有强相关性。JPEG对量化后的DC系数采用DPCM 编码, 即对DIFF= DCi-DCi-1编码。 AC系数的行程编码 其余63个交流系数(AC)采用行程编码。 从左上方AC0,1开始沿对角线方向“Z”字形扫描直到AC7,7扫描结束, 这样可增加行程中连续0的个数。 AC系数编码的码字用两个字节表示,如图所示: AC系数行程编码码字 熵编码 为了进一步压缩数据,需对DC码和AC行程编码的码字再做基于统计特性的熵编码。 JPEG建议的熵编码是Huffman编码和自适应二进制算术编码。 熵编码可分成两步进行: 把DC码和AC行程码转换为中间符号序列 给这些符号赋以变长码字 AC系数熵编码的中间格式 熵编码的中间格式由两个符号组成: 符号1: (行程,尺寸) 符号2: (幅值) 第一个信息参数“行程”表示前后两个非0的AC系数之间连续0的个数。 第二个信息参数“尺寸”是后一个非0的AC系数幅值编码所需比特数。 行程取值范围为1~15, 超过15时用扩展符号1 (15, 0)来扩充, 63个AC系数最多增加3个扩展符号1。编码结束时用(0,0)表示。 “尺寸”取值范围为0~10。 “幅值”用以表示非0的AC系数的值, 范围为[-210, 210-1](最长10bit), 结

文档评论(0)

5500046 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档