网络多媒体技术(西电版)第3章 多媒体数据压缩编码标准.pptVIP

网络多媒体技术(西电版)第3章 多媒体数据压缩编码标准.ppt

  1. 1、本文档共125页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

;在多媒体系统中,多媒体数据编码标准是系统设计、开发和应用的根底。本章介绍音频、图像及视频压缩编码标准。;;2.参数编码

参数编码是基于声学参数进行音频数据压缩的编码方法。人类的发声器官产生声音的过程可以用一个数学模型来逼近,参数编码就是通过计算表征这个发声模型的参数并对其进行编码来进一步降低数据率的。常用的音频参数有共振峰、线性预测系数、滤波器组等。

参数编码的优点是压缩比高,语音编码速率较低,根本上在2~9.6kb/s之间。其缺点首先是合成语音质量较差,往往清晰度满足要求而自然度不好,难于识别说话人是谁;其次是电路实现的复杂度比较高。;目前,编码速率小于16kb/s的低比特语音编码大都采用参数编码。参数编码在移动通信、多媒体通信和IP网络应用中都起到了重要的作用。

参数编码的典型代表是线性预测编码(LPC)。;3.混合编码

混合编码是将波形编码的高质量与参数编码的低数据率结合起来的编码方法,以求能在较低数据率下获得较高的音质。其根本原理是合成分析方法,即将综合滤波器引入编码器,与分析器相结合,在编码器中将鼓励输入综合滤波器,产生与译码器端完全一致的合成语音,然后将合成语音与原始语音相比较(波形编码思想),根据均方误差最小原那么,求得最正确的鼓励信号,然后把鼓励信号以及分析出来的综合滤波器编码送给解码端。这种得到综合滤波器和最正确鼓励的过程称为分析(得到语音参数),用鼓励和综合滤波器合成语音的过程称为综合。;由此可见,混合编码把参数编码和波形编码的优点结合在了一起,使得用较低码率产生较好的音质成为可能。

常见的混合编码包括码本鼓励线性预测编码(CELP)、多脉冲鼓励线性预测编码(MPLPC)、多脉冲最大似然量化编码(MP-MLQ)以及G.728、GSM标准等。;4.感知编码

感知编码是基于人耳的听觉特性,通过消除不被感知的冗余信息来实现对音频数据压缩的编码方法。它基于心理声学模型,利用人的听觉阈值特性和掩蔽效应,通过给不同频率处的信号数据分量分配以不同量化比特的方法来控制量化噪声,使得噪声能量低于掩蔽阈值,即把压缩带来的失真控制在听阈以下,使人耳觉察不到失真的存在,从而实现更高效率的音频压缩。目前,在高质量音频编码标准中,心理声学模型是一个最为有效的算法模型。

在此类编码中,以MPEG音频编码(MPEGLayer-1、2、3和AAC标准)和DolbyDigital的应用最为广泛。;3.1.2音频压缩编码标准

音频信号的压缩编码主要包括ITU制定的G.7XX系列和ISO/IEC制定的MPEG-X系列标准。

系列中的波形编码标准

采用波形编码的编码标准有G.711标准、G.721标准和G.722标准。;在5级的MOS评价等级中,其评分等级到达4.3,语音质量很好;编/解码延时只有0.125ms,可以忽略不计;算法的复杂度是最低的,定为1,其他编码方法的复杂度都与此作比照。;3) G.722标准

G.722标准是针对调幅播送质量的音频信号制定的压缩标准,音频信号质量高于G.711和G.721标准。调幅播送质量的音频信号的频率范围是50Hz~7kHz。此标准是在1988年由CCITT制定的,采用的编码方法是子带自适应差分脉冲编码调制SB-ADPCM编码方法,即将语音频带划分为高和低两个子带,高、低子带间以4kHz频率为界限,在每个子带内采用自适应差值脉冲编码调制方式。其采样频率为16kHz,编码比特数为14bit,编码后的信号速率为224kb/s。;G.722标准能将224kb/s的调幅播送质量信号速率压缩为64kb/s,而质量又保持一致,可以在多媒体和视频会议方面得到应用。G.722编码器所引入的延时时间限制在4ms之内。;即5个抽样点的时间,此即为G.728声码器码流的帧长。由于使用反响型自适应方法,因此预测器不需要传送预测系数,唯一需要传送的就是鼓励信号的量化值。此编码方案是对所有取样值以矢量为单位进行处理的,并且采用了线性预测和增益自适应方法。G.728的码本总共有1024个矢量,即量化值需要10个比特,因此其比特率为10/625=16kb/s。

G.728也是低速率的ISDN可视的推荐语音编码器标准,速率是56~128kb/s。由于这一标准具有反向自适应的特性,因此它可以实现低的延时,但其复杂度较高。;日本和美国的系统速率为8kb/s左右,GSM系统的速率为13kb/s。由于应用在移动系统,因此其复杂程度要比G.728低,为中等复杂程度的算法。由于其帧长时间加大了,故所需的RAM容量比G.728多一半。;3.MPEG音频编码标准

1) MPEG-1

MPEG-1Audio(ISO/IEC11172-3)

您可能关注的文档

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档