《预测编码》课件.ppt

下载文档

142
0
约6.15千字
约 77页
2018-11-29 发布于广西
举报
版权申诉
保障服务

《预测编码》课件.ppt

1、本文档共77页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

数字视频图像处理数据压缩教学要求及内容一、教学基本要求了解音频信号与听觉感知、视频信号与视觉感知；理解DPCM的基本原理、最佳线性预测，语音信号、静止图像、活动图像的预测编码的思想；掌握MMSE线性预测、语音信号、静止图像、活动图像的预测编码的方法。二、教学内容 1、DPCM的基本原理； 2、音频信号与听觉感知、视频信号与视觉感知； 3、语音信号的预测编码、静止图像的预测编码、活动图像的预测编码。数据压缩的基本途径之三：对于离散有记忆平稳信源：理论上，可以通过它的条件概率计算极限熵。实际上，可利用概率进行编码，阶越高越有利。预测编码原理　　基本思想是这样的：模型→利用以往的样本数据→对下一个新的样本值进行预测→ 将预测所得的值与实际值的差值进行编码→由于差值很小，可以减少编码的码位。例　　　对图像数据压缩来说，预测编码方法是从相邻象素之间有很强的相关性特点考虑的。比如当前像素的灰度或颜色信号，数值上与其相邻像素总是比较接近，除非处于边界状态。那么，当前像素的灰度或颜色信号的数值，可用前面已出现的像素的值，进行预测（估计），得到一个预测值（估计值），将实际值与预测值求差，对这个差值信号进行编码、传送。 5.1DPCM的基本原理 DPCM预测压缩算法　　DPCM是差分脉冲编码调制算法，主要用于图象压缩。　　DPCM的基本工作原理如下：　　比较相邻的两个像素，如果两个像素之间存在差异，将差异之处的差值传送出去，若比较的像素之间没有差异，则不传送差值。 ADPCM自适应差分编码　　ADPCM自适应差分编码调制编码具有自适应特性，该编码包括自适应量化和自适应预测两种形式，主要用于对中等质量的音频信号进行高效率压缩，例如语音信号的压缩、调幅广播音质的信号压缩等。 (1)自适应量化--在一定的量化级数下，减少量化误差或在相同误差情况下压缩数据。自适应量化必须具有对输入信号幅度值的估算能力，否则无法确定信号改变量的大小。(2)自适应预测--根据常见的信息源求得多组固定的预测参数，将预测参数提供给编码使用。在实际编码时，根据信息源的特性．以实际值与预测值的均方差最小为原则。自适应地选择其中一组固定的预测参数进行编码。 5.2最佳线性预测 5.2.1MMSE线性预测考虑人主观感知效果，MMSE来度量音频与视频时，会出现大的出入电视编码中常采用主观准则 5.3音频信号与听觉感知声音在空气中的传播：波人耳所能听到的声音频率：20Hz-20kHz 5.3.1语音信号的时域冗余度语音信号中存在的冗余（时域）幅度非均匀分布样本间的相关周期之间的相关静止系数（话音间隙）长时自相关函数基音之间的相关 5.3.2语音信号的频域冗余度语音信号的频域冗余度分类非均匀的长时功率谱密度语音特有的短时功率谱密度 5.3.3单音的听觉感知 HAS的感知：响度：频率：相位： 5.3.4多音的掩蔽效应掩蔽效应：如果两个声音，一个声音的存在会影响人耳对另一个声音的听觉能力掩蔽效应声强频率相对方向延续时间同时掩蔽效应：一个能量较大的信号（掩蔽信号）可以使另一个同时出现的能量较低的信号（被掩蔽信号）变得不能为人耳所闻，只要两者的频率相差足够小。 HAS的同时掩蔽效应对于音频压缩的指导作用：强度低于掩蔽声级的音频分量人耳都听不到，因此可更经济地合理地分配好有限的编码既然可在受掩蔽的频带内给输入信号添加更大的噪声，若能将量化噪声的频谱幅度控制在AMT以下，则将改善数字音频信号的主观质量。瞬时掩蔽效应：一种频域听觉现象，即不同时间先后产生的声音之间的掩蔽现象。可分为：前掩蔽：强声掩蔽其后的弱声音。后掩蔽：弱声音被其后产生的强声音所掩蔽。瞬时掩蔽效应可应用在逐帧编码算法中出现的扩散噪声和回声 5.4语音信号的预测编码语音信号的普遍性语音信号压缩的要求：可懂度和音质限比特率降低编码过程的计算代价 5.4.1技术与标准的沿革波形编码参数编码增量调制 DPCM/ADPCM LPC声码器混合编码语音信号的主要国际标准 5.4.2LPC语音合成模型 5.4.3线性预测合成－－分析编码合成原理：线性分析模块处理顺序：求预测系数去除长相关性对残差信号采用不同量化，得到不同的编码输出 A：MP－LPC B：RPELPC CELP 5.5静止图像预测编码矢量图形点阵图像－－数据压缩重点考虑 5.5.1帧内预测器的设计预测分类： 1D预测 2D预测 3D预测 5.5.2JPEG的无损压缩模式 5.5.3JPEG－LS压缩标准实现步骤：基于上下文的建模预测常规模式的误差编码游程编码模式 5.5.4H.264和AVS的帧内预测模式九种预测模式分别为：模式0：垂