14章MPEG声音压缩.pptVIP

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
14章MPEG声音压缩

MPEG1音频解码器的原理框图 逆变换器 重 建 frame unpacking PCM声音 MPEG-1 音频比特流 辅助数据 进行差错检测、比特流分解,恢复出各种信息段 恢复被量化的子带样本值以重建声音信号 逆变换模块将这些样本从频率域变换回时间域中均匀的声音样本 小 结 层 1: 每帧一个样本组、子带频宽相等、每帧32×12=384个样本、仅用到频率掩蔽效应。 层 2:每帧三个样本组、子带频宽相等、每帧32×12×3=1152个样本、不仅用到频率掩蔽效应,还用到时域掩蔽效应。 层 3: 子带频宽与临界频宽相似, 用到频率掩蔽效应和时域掩蔽效应, 考虑到立体声冗余, 采用Huffman编码。 MPEG-2音频 MPEG-2音频 (1) MPEG-2 Audio(ISO/IEC 13818-3),或者称为MPEG-2多通道(Multichannel)声音,又称为MPEG-2 BC (Backward Compatible)。 (2) MPEG-2 AAC (ISO/IEC 13818-7, Advanced Audio Coding),也称为MPEG-2 NBC(Non-Backward-Compatible)标准。 MPEG-2 Audio(13818-3) MPEG-2 Audio 增加了16 kHz, 22.05 kHz和24 kHz采样频率声音的处理, 扩展了编码器的输出速率范围,由32~384 kbps扩展到8~640 kbps, 增加了声道数,支持5.1声道和7.1声道的环绕立体声。 MPEG-2 音频编码器 16, 22.05, 24, 32, 44.1, 48kHz 8~640 kbps MPEG-2的环绕立体声 MPEG-2 Audio的“5.1环绕立体声”也称为“3/2-立体声加LFE”, 放音现场前方有3个喇叭 (左、中、右3个声道),后面有2个喇叭(2个环绕声道),“.1”指LFE(low frequency effects),即低频音效加强声道。 MPEG Audio的应用 优点: 声音品质优良 码率范围较宽 多种不同配置 四大应用领域: 广播, 存储, 多媒体 通讯 MPEG-2 AAC (Advanced Audio Coding)(ISO/IEC 13818-7 ) MPEG-2 AAC的性能 取样频率: 从8 kHz到96 kHz, 编码器输入: 单声道、立体声和多声道声音。 最多可支持: 48个主声道、16个低频音效通道LFE (low frequency effects)、16个配音声道(也称为多语言声道) 和16个数据流。 在压缩比为11:1(即每个声道数据率为44.1× 16/11 = 64kbps),5声道的总码率为320 kbps的情况下,重建声音与原始声音之间几乎无区别。 音质相同时,码率仅MP2的50%, MP3的70% MPEG-2 AAC 的特点 比MP3更加灵活, 如: 取样频率和码率的范围更大, 声道数目更多, 具有多语言能力, 支持16个嵌入数据流等, 编码器/解码器的结构是模块化的 AAC使用了更加先进的算法及工具, 如: 分辨率更精细的滤波器组, 时域噪音定形( temporal noise shaping,TNS), 反向自适应线性预测(backward adaptive linear prediction), 联合立体声编码技术(joint stereo coding techniques) 改进的 Huffman coding, MPEG-2 AAC编码器 输入信号 13818-7声音数据流 过去帧的量化频谱 迭代环 由多相正交滤波器、增益检测器和增益修正器组成。它把输入信号分离到4个相等带宽的频带中,通过忽略高频带信号而获得低取样率的输出信号,从而达到取样频率可调的目的。 输入信号 13818-7声音数据流 迭代环 过去帧的量化频谱 把输入信号从时域变换到频域,采用了改进的离散余弦变换MDCT,它是一种线性正交交迭变换,使用了一种称为时域去混迭技术. 输入信号 13818-7声音数据流 迭代环 过去帧的量化频谱 用来控制量化噪声,以解决掩蔽阈值和量化噪声的错误匹配问题。 输入信号 13818-7声音数据流 迭代环 过去帧的量化频谱 联合立体声编码, 目的是为了去掉声道之间的冗余信息。包含两种空间编码技术:M/S编码(Mid/Side encoding)和声强/耦合(Intensity /Coupling)。 输入信号 13818-7声音数据流 迭代环 过去帧的量化频谱 主要用来减少平稳(stationary)声音信号的冗余度。 输入信号 13818-7声音数据流 迭代环 过去帧的量化频谱 对被量化的谱系数、比例因子和

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档