- 1、本文档共77页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数字视频图像处理 数据压缩 教学要求及内容 一、教学基本要求 了解音频信号与听觉感知、视频信号与视觉感知; 理解DPCM的基本原理、最佳线性预测,语音信号、静止图像、活动图像的预测编码的思想; 掌握MMSE线性预测、语音信号、静止图像、活动图像的预测编码的方法。 二、教学内容 1、DPCM的基本原理; 2、音频信号与听觉感知、视频信号与视觉感知; 3、语音信号的预测编码、静止图像的预测编码、活动图像的预测编码。 数据压缩的基本途径之三:对于离散有记忆平稳信源: 理论上,可以通过它的条件概率计算极限熵。 实际上,可利用概率进行编码,阶越高越有利。 预测编码原理 基本思想是这样的:模型→利用以往的样本数据→对下一个新的样本值进行预测→ 将预测所得的值与实际值的差值进行编码→由于差值很小,可以减少编码的码位。 例 对图像数据压缩来说,预测编码方法是从相邻象素之间有很强的相关性特点考虑的。比如当前像素的灰度或颜色信号,数值上与其相邻像素总是比较接近,除非处于边界状态。那么,当前像素的灰度或颜色信号的数值,可用前面已出现的像素的值,进行预测(估计),得到一个预测值(估计值),将实际值与预测值求差,对这个差值信号进行编码、传送。 5.1DPCM的基本原理 DPCM预测压缩算法 DPCM是差分脉冲编码调制算法,主要用于图象压缩。 DPCM的基本工作原理如下: 比较相邻的两个像素,如果两个像素之间存在差异,将差异之处的差值传送出去,若比较的像素之间没有差异,则不传送差值。 ADPCM自适应差分编码 ADPCM自适应差分编码调制编码具有自适应特性,该编码包括自适应量化和自适应预测两种形式,主要用于对中等质量的音频信号进行高效率压缩,例如语音信号的压缩、调幅广播音质的信号压缩等。 (1)自适应量化--在一定的量化级数下,减少量化误差或在相同误差情况下压缩数据。自适应量化必须具有对输入信号幅度值的估算能力,否则无法确定信号改变量的大小。(2)自适应预测--根据常见的信息源求得多组固定的预测参数,将预测参数提供给编码使用。在实际编码时,根据信息源的特性.以实际值与预测值的均方差最小为原则。自适应地选择其中一组固定的预测参数进行编码。 5.2最佳线性预测 5.2.1MMSE线性预测 考虑人主观感知效果,MMSE来度量音频与视频时,会出现大的出入 电视编码中常采用主观准则 5.3音频信号与听觉感知 声音在空气中的传播:波 人耳所能听到的声音频率:20Hz-20kHz 5.3.1语音信号的时域冗余度 语音信号中存在的冗余(时域) 幅度非均匀分布 样本间的相关 周期之间的相关 静止系数(话音间隙) 长时自相关函数 基音之间的相关 5.3.2语音信号的频域冗余度 语音信号的频域冗余度分类 非均匀的长时功率谱密度 语音特有的短时功率谱密度 5.3.3单音的听觉感知 HAS的感知: 响度: 频率: 相位: 5.3.4多音的掩蔽效应 掩蔽效应:如果两个声音,一个声音的存在会影响人耳对另一个声音的听觉能力 掩蔽效应 声强 频率 相对方向 延续时间 同时掩蔽效应:一个能量较大的信号(掩蔽信号)可以使另一个同时出现的能量较低的信号(被掩蔽信号)变得不能为人耳所闻,只要两者的频率相差足够小。 HAS的同时掩蔽效应对于音频压缩的指导作用: 强度低于掩蔽声级的音频分量人耳都听不到,因此可更经济地合理地分配好有限的编码 既然可在受掩蔽的频带内给输入信号添加更大的噪声,若能将量化噪声的频谱幅度控制在AMT以下,则将改善数字音频信号的主观质量。 瞬时掩蔽效应:一种频域听觉现象,即不同时间先后产生的声音之间的掩蔽现象。 可分为: 前掩蔽:强声掩蔽其后的弱声音。 后掩蔽:弱声音被其后产生的强声音所掩蔽。 瞬时掩蔽效应可应用在逐帧编码算法中出现的扩散噪声和回声 5.4语音信号的预测编码 语音信号的普遍性 语音信号压缩的要求: 可懂度和音质 限比特率 降低编码过程的计算代价 5.4.1技术与标准的沿革 波形编码 参数编码 增量调制 DPCM/ADPCM LPC声码器 混合编码 语音信号的主要国际标准 5.4.2LPC语音合成模型 5.4.3线性预测合成--分析编码 合成原理: 线性分析模块处理顺序: 求预测系数 去除长相关性 对残差信号采用不同量化,得到不同的编码输出 A:MP-LPC B:RPELPC CELP 5.5静止图像预测编码 矢量图形 点阵图像--数据压缩重点考虑 5.5.1帧内预测器的设计 预测分类: 1D预测 2D预测 3D预测 5.5.2JPEG的无损压缩模式 5.5.3JPEG-LS压缩标准 实现步骤: 基于上下文的建模 预测 常规模式的误差编码 游程编码模式 5.5.4H.264和AVS的帧内预测模式 九种预测模式分别为: 模式0:垂
您可能关注的文档
最近下载
- 必威体育精装版最完整的的厂房设施确认实施方案.pdf
- 工程造价专业大学生职业生涯规划书.docx VIP
- 档案管理10号令解读(网).ppt
- 重庆《轻质隔墙条板应用技术标准》DBJ50T 338-2019.pdf
- (冀人版)科学五年级上册全册知识点.docx
- 电子工业版信息科技七年级上册3-1 “互联网+”在学习中的应用 教案.pdf VIP
- 2024-2025学年高中生物 第4章 种群和群落 第4节 群落的演替说课稿 新人教版必修3.docx
- 10 数学史问题与一元一次方程(含答案析) -七年级数学之专攻一元一次方程各种类型题的解法(人教版).docx
- 锅炉本体焊接作业指导书.pdf
- 钣金加工:折弯工艺手册.doc VIP
文档评论(0)