数字视频通信DVT03h_音频压缩.ppt

  1. 1、本文档共165页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
门爱东教授 menad@ Beijing 数字视频通信 Digital Video Telecommunication 引言-数字音频的数据量 数字化是趋势 信息量非常大,高传输带宽或存储容量 5.1 声道环绕立体声: 6×48KHz×16bits=4.608Mbit/s 电声产品的听感测试 什么声信号有资格进行电声产品的听感测试? 声信号样件的充分性: 信号样件应尽量多地反映各种声音特征 声信号样件的代表性: 信号样件应能够充分代表同类声音信号 对电声产品的听觉缺欠判断能力: 能够较容易地判断电声产品的听觉缺欠 什么声环境有资格进行电声产品的听感测试? 重放环境的反射声必须足够弱: 重放房间产生的“二次反射声”会对电声产品的重放声产生干扰和附加“染色”, 因而重放房间应该进行相当强的吸声处理, 称为保证“声学比”。 重放环境的背景噪声必须足够低: 环境噪声对判断电声产品的听觉质量会有影响,因而重放房间应该进行严格的隔声处理, 称为保证“信噪比”。 什么人有资格进行电声产品的听感测试? 听感测试人 听感评价人 的听觉生理: 不言而喻, 听感测试人必须具有良好的听觉生理, 能够判断重放声的细微差异 , 以及具备不受参考声影响而能记住常遇到的声源声色的绝对记忆能力。 听感测试人 听感评价人 的音乐水平: 不言而喻, 听感测试人必须具有相当的音乐水平, 对常遇到的器乐和声乐作品和乐理相当熟悉。 声音压缩编码理论基础 冗余(Redundance 信号一部分可由另一部分重建或另外表达形式简单说明,称为信号有冗余 去除冗余实现压缩编码 信号冗余是变化的,故不能产生恒定码流输出 不相关 (Irrelevance 听觉不能感觉的那部分信号,它对声音信号的确定或音色和发音位置没有贡献 不相关信号部分不传输 利用掩蔽效应来掩盖量化失真 人耳听觉特性 人耳分辨能力 人耳对不同频段声音的敏感程度不同,通常对低频比对高频更敏感 人耳对语音信号的相位不敏感 人耳掩蔽效应 Masking Effect … 由等响曲线可以看出不同的声音强度人的听觉频响不同! 将不同强度的听觉频响典型曲线规范成用于模拟听觉频响的计权曲线 人的听觉生理延时效应声信号在时域上的听觉融合! 人耳掩蔽效应 Masking 掩蔽效应 掩蔽效应: 一个声音的存在掩蔽了另一个声音的存在 掩蔽效应是一个较为复杂的心理和生理现像 掩蔽程度与两个声音的相关性有密切联系 分为频域效应和时域掩蔽效应 准稳态 短时稳态 信号特性,利用频域掩蔽效应 对于声音的时域结构特性,利用时域掩蔽特性 人耳掩蔽效应 Masking 频域掩蔽效应 Frequeney domain masking effect 声音压缩采用单频声音的掩蔽效应 两个声音频率相同时,掩蔽效应最明显 在高频端,随着两者频率偏离,掩蔽效果缓慢减弱 在低频端,随着两者频率偏离,掩蔽效应急剧减小 时域和频域掩蔽效应的折衷 稳态信号,滤波器组要有好的频谱分辨力,这意味着需要一个长的窗函数或长的 FIR 滤波器。 瞬态信号,滤波器组要有好的时间分辨力,这就要求短的窗函数和 FIR 长度。 人耳对声音的方向特性 ISO/IEC MPEG-Audio MPEG1 Layer I、II、III MP3 MPEG2 Audio MPEG2 AAC MPEG4 Auido ISO/MPEG1/Audio 起源 MPEG 组织:ISO/IEC JTC1/SC29/WG11,即MPEG 任务:负责比较和评估几种低码速率数字声音编码技术,以产生一套国际标准 1992年11月完成“低于1.5Mbit/s的用于数字存储媒体的活动图象和相关声音之国际标准”,即MPEG1 它主要包括三个部分:系统、视频和声音 MPEG2 是 MPEG1 的后继版本 MPEG-1声音的标准和质量评定 ISO/MPEG/Audio 声音编码标准是数字声音压缩的第一个国际标准 声音小组负责产生PCM声音信号的编码标准 该小组收集到14份建议,分为四组:ASPEC、ATAC、MUSICAM 和SB\ADPCM。 MPEG1/Audio的通用编码概念 层的概念:根据不同的应用需要,选用性能和复杂性不同的系统编码层 分为三层:Layer I、II、III 一个标准的 ISO 解码器应能对任何一层编码码流解码 一个标准第 x 层解码器能对 x-n 层编码码流解码 Layer I 它是 MUSICAM 编码方案的简化版本 编码技术 数字音频输入变换为 32 个子带; 固定分段 心理模型 I 自适应比特分配; 均匀量化 每帧包含 384 个样值 应用:那些不要求很低码率的应用,但对时延要求高

文档评论(0)

tcpe + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档