第二章音频处理.ppt

下载文档 降价啦

55
0
约1.25万字
约 90页
2016-08-03 发布于广东
举报
版权申诉
保障服务

第二章音频处理.ppt

1、本文档共90页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第二章音频处理

第2章音频处理人耳能识别的声音频率范围大约在20~20k Hz，通常称为音频（audio）信号。人的发音器官发出的声音范围大约在80~3400Hz，但人说话的信号频率通常为300~3000Hz，称为语音（speech）信号。低于20Hz的信号称为次声波（subsonic），高于20k Hz称为超声波（ultrasonic）。次声波和超声波人耳都无法听到。声音的频率范围计算机音频处理涉及的内容包括：音频传播媒体特征,也即声波的物理特性。音频的记录和产生方式，包括模/数、数/模转换；数据压缩和声音合成。音频数据的编辑处理。对音频信号的处理方法大致可分为三类：波形编译码器，音源编译码器，混合编译码器。第1节音频信号正弦波有两个重要参数：频率ω0、幅度An 。声音的三个要素是音调、音量和音色。声音有以下一些特点： 1.音调：声音的高低。音调正是由频率ω所决定的。频率越高音调越高（频率单位Hz ） 2. 音量：人主观上感觉声音的大小，以分贝（dB）为单位。 3. 音色：音色是声音的特色，根据不同的音色，即使在同一音调和同一声量的情况下，也能区分出是不同乐器或人声发出的。二、音频数字化模拟信号：时间上连续，幅值上也连续的信号。数字信号：时间上和幅值上都用离散的数字表示的信号。 A/D变换：把连续变化的模拟信号转换成数字信号。 A/D变换一般要由两步完成：采样和量化。 (1)采样采样是将时间上、幅值上都连续的模拟信号，在采样脉冲的作用，转换成时间上离散、但幅值上仍连续的离散模拟信号。每秒钟的采样样本数叫做采样频率。奈奎斯特理论：只有当采样频率高于声音信号最高频率的两倍时，才能把离散模拟信号表示的声音信号唯一地还原成原来的声音。目前在多媒体系统中捕获声音的标准采样频率定为44.1kHz、22.05kHz和11.025kHz三种。 (2)量化所谓量化就是把采集到的数值送到量化器（A/D转换器）编码成数字，每个数字代表一次采样所获得的声音信号的瞬间值。目前常用量化数据位来表示量化级，例如数据位为8位，则表示28个量化级，最高量化级有216个（=65536个）等级。量化噪声：量化过程存在量化误差，反映到接收端，这种误差作为噪声再生。采样时的声道数有单声道和双声道两种。 AV文件的数据量的计算公式：数据量 = 采样频率（Hz）× 采样精度（位）× 声道数 ÷ 8 （dB）计算：用44.1kHz采样频率采样，每个样本使用16位采样精度存储，则录制一分钟的立体声节目，音频WAV文件的存储量？使用22.05kHz的采样频率和8位采样精度，录制一分钟调幅音频的WAV文件存储量？三. 数字音频技术指标 1．采样频率：如果对某一模拟信号进行采样，则采样后可还原的最高信号频率只有采样频率的一半，或者说只要采样频率高于输入信号最高频率的两倍，就能从采样信号系列重构原始信号。 2．量化位数：量化位是对模拟音频信号的幅度轴进行数字化，它决定了模拟信号数字化以后的动态范围。 3．声道数：有单声道、双声道、多声道之分。三、常见声音文件的格式常见的声音文件为：WAV文件、VOC文件、AU文件和MID文件。 (1) WAV声音文件格式：WAV文件是从模拟声波采样后得到的一种波形文件，使用于Windows操作系统，其格式是由文件首部与文件数据块组成。 (2) VOC声音文件格式：VOC文件是用于DOS操作系统下的一种波形文件。 (3) AU声音文件格式：用于UNIX操作系统下的一种波形文件。 (4) MID文件格式：MID文件是一种记录数字化音乐的MIDI文件。四.音频信号的指标 1. 频带宽度：音频信号的频带越宽，所包含的音频信号分量越丰富，音质越好。 2．动态范围:动态范围越大，信号强度的相对变化范围越大，音响效果越好。 3．信噪比：信噪比SNR（Signal to Noise Ratio）是有用信号与噪声之比的简称。 4．主观度量法：人的感觉机理对声音的度量最有决定意义。声音的质量分为了五个等级，由低到高分别是：电话(telephone)、调幅广播(AM)、调频广播(FM)、光盘(CD)、数字录音带(DAT) 第2节? 音频数字压缩一．音频压缩编码技术主要有以下几种主要类型： 1．熵编码 :如Huffman编码、算术编码以及行程编码等。 3.参数编码：参数编码的方法是将音频信号以某种模型表示，再抽出合适的模型参数和参考激励信号进行编码；声音重放时，再根据这些参数重建即可。此类方法构成声码器的有线性预测(LPC)声码器、通道声码器、共振峰声码器等。 4．混合编码：音频中采用的混合编码包括多