多媒体技术_音频处理讲义.ppt

下载文档 降价啦

18
0
约1.12万字
约 84页
2017-04-28 发布于湖北
举报
版权申诉
保障服务

多媒体技术_音频处理讲义.ppt

1、本文档共84页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第4章音频处理;第4章音频处理; 声音是指人耳能识别的音频信息.如人发出的话音，乐器声，动物发出的声音，机器产生的声音，自然界的雷声，风声、雨声、闪电声等，也包括各种人工合成的声音。声音涉及到声波的物理传播特点和电声信号处理技术。多媒体技术的发展使计算机处理音频信息已达到较成熟的阶段。;;人的听觉响应与强度成对数关系。只有在强度适中时才最灵敏。一般的人只能察觉出3 分贝的音强变化。常用音量或响度来描述声音强度，以分贝（dB）为单位。在处理音频信号时，相对强度更有意义。动态范围定义：动态范围＝20 log（信号的最大强度 / 信号的最小强度）（dB）动态范围越大，信号强度的相对变化范围越大，音响效果越好。 ;; 基频：ωO ，决定音调泛音：n×ωO 称为基频的高次谐波分量音色：由混入基音的泛音所决定的高次谐波越丰富,音色就越有明亮感和穿透力不同的谐波具有不同的幅值和相位偏移，产生各种音色效果能够用来描述乐器声的区别 ;频率特性;音色;频率特性;信噪比（SNR，Signal to Noise Ratio）是有用信号与噪声之比的简称是衡量声音质量的一种指标噪音可分为环境噪音和设备噪音信噪比越大，声音质量越好;其他音频质量指标;听觉生理;采样频率：采样频率是指一秒钟内采样的次数。采样频率的选择应该遵循奈奎斯特（Harry Nyquist）采样理论：如果对某一模拟信号进行采样，则采样后可还原的最高信号频率只有采样频率的一半。量化位数：量化位是对模拟音频信号的幅度轴进行数字化所采用的位数，它决定了模拟信号数字化以后的动态范围声道数：有单声道、双声道、多声道之分。双声道在硬件中要占两条线路，音质、音色好，但数字化后所占空间比单声道多一倍。;声音质量与数据率;编码算法作用采用一定的格式来纪录数字数据采用一定的算法来压缩数字数据以减少存贮空间和提高传输效率包括有损压缩和无损压缩有损压缩指解压后数据不能完全复原，要丢失一部分信息。基本指标之一是压缩比压缩越多，信息丢失越多、信号还原后失真越大应根据不同的应用选用不同的压缩编码算法 ;音频压缩编码技术;熵编码如Hufman编码、算术编码以及行程编码等。波形编码全频带编码如PCM、自适应差分PCM等，子带编码如自适应变换编码ATC、心理学模型等，以及向量量化等在音频中均常常采用。波形编码的特点是在高码率的条件下获得高质量的音频信号，适用于高保真度语音和音乐信号的压缩技术。参数编码参数编码的方法是将音频信号以某种模型表示，再抽出合适的模型参数和参考激励信号进行编码；声音重放时，再根据这些参数重建即可。参数编码压缩比很高，但计算量大，而且不适合高保真度要求的场合。 ;混合编码是一种吸取波形和参数编码的优点，进行综合的编码方法。感知编码感知编码利用心理声学分析原理来实现音频压缩。例如MPEG Audio Layer 3 采用的算法ASPEC（Adaptive Spectral Perceptual Entropy Coding of high quality musical signal，高质量音乐信号自适应谱感知熵编码），将原始音频信息数据压缩率达到10:1 甚至12:1。当然这是一种有损压缩，但是人耳却基本不能分辨出失真来。;波形编码 ;实际应用中为了得到高的压缩率和好的声音质量，常常要同时利用时域-频域分析与心理声学分析，并使用多种编码方法;实际应用考虑（续）;电话质量的音频压缩编码技术标准 ;调幅广播质量的音频压缩编码技术标准 ; MPEG-1音频;声音编码系统基本结构 ;(a)编码器 ;第1层和第2层编码在这两层中，用有32个等间距子带的滤波器组将输入声音PCM信号子带分离，再由生理声学模型导出动态比特分配，然后进行子带样值的块压缩和比特流打包。; 使用的滤波器组是多相混合滤波器组使用了心理声学模型来评估掩蔽门限。为了增加编码增益，采用了非均匀量化和Huffman编码。并且使用了称为比特池的缓存技术来维持编码效率和使量化噪声保持在掩蔽门限以下。; MP3（MPEG-1 Layer 3），是当今较流行的一种音频格式，全称为MPEG(MPEG：Moving Picture Experts Group) Audio Layer-3。MP3是一种有损压缩，它利用了人耳的听觉特性来提高压缩率的算法。在基本上保持CD音质的前提下，MP3能将音频数据压缩到原有的1/10甚至更少。 MP3格式最早由德国弗朗霍夫研究院和法国汤姆生公司在1993年合作研制成功。但当时的MP3格式并不完善，由于MP3的编码方式开放，人们可以选择不同的原理进行压缩