第二章音频处理.ppt

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章音频处理

第2章 音频处理 人耳能识别的声音频率范围大约在20~20k Hz,通常称为音频(audio)信号。 人的发音器官发出的声音范围大约在80~3400Hz,但人说话的信号频率通常为300~3000Hz,称为语音(speech)信号。 低于20Hz的信号称为次声波(subsonic),高于20k Hz称为超声波(ultrasonic)。 次声波和超声波人耳都无法听到。 声音的频率范围 计算机音频处理涉及的内容包括: 音频传播媒体特征,也即声波的物理特性。 音频的记录和产生方式,包括模/数、数/模转换;数据压缩和声音合成。 音频数据的编辑处理。 对音频信号的处理方法大致可分为三类:波形编译码器,音源编译码器,混合编译码器。 第1节 音频信号 正弦波有两个重要参数:频率ω0、幅度An 。 声音的三个要素是音调、音量和音色。 声音有以下一些特点: 1.音调:声音的高低 。音调正是由频率ω所决定的。频率越高音调越高 (频率单位Hz ) 2. 音量:人主观上感觉声音的大小 ,以分贝(dB)为单位。 3. 音色:音色是声音的特色,根据不同的音色,即使在同一音调和同一声量的情况下,也能区分出是不同乐器或人声发出的。 二、音频数字化 模拟信号:时间上连续,幅值上也连续的信号。 数字信号:时间上和幅值上都用离散的数字表示的信号。 A/D变换:把连续变化的模拟信号转换成数字信号。 A/D变换一般要由两步完成:采样和量化。 (1)采样 采样是将时间上、幅值上都连续的模拟信号,在采样脉冲的作用,转换成时间上离散、但幅值上仍连续的离散模拟信号。 每秒钟的采样样本数叫做采样频率。 奈奎斯特理论:只有当采样频率高于声音信号最高频率的两倍时,才能把离散模拟信号表示的声音信号唯一地还原成原来的声音。 目前在多媒体系统中捕获声音的标准采样频率定为44.1kHz、22.05kHz和11.025kHz三种。 (2)量化 所谓量化就是把采集到的数值送到量化器(A/D转换器)编码成数字,每个数字代表一次采样所获得的声音信号的瞬间值。 目前常用量化数据位来表示量化级,例如数据位为8位,则表示28个量化级,最高量化级有216个(=65536个)等级。 量化噪声:量化过程存在量化误差,反映到接收端,这种误差作为噪声再生。 采样时的声道数有单声道和双声道两种。 AV文件的数据量的计算公式:数据量 = 采样频率(Hz)× 采样精度(位)× 声道数 ÷ 8 (dB) 计算: 用44.1kHz采样频率采样,每个样本使用16位采样精度存储,则录制一分钟的立体声节目,音频WAV文件的存储量? 使用22.05kHz的采样频率和8位采样精度,录制一分钟调幅音频的WAV文件存储量? 三. 数字音频技术指标 1.采样频率:如果对某一模拟信号进行采样,则采样后可还原的最高信号频率只有采样频率的一半,或者说只要采样频率高于输入信号最高频率的两倍,就能从采样信号系列重构原始信号。 2.量化位数:量化位是对模拟音频信号的幅度轴进行数字化,它决定了模拟信号数字化以后的动态范围。 3.声道数:有单声道、双声道、多声道之分。 三、常见声音文件的格式 常见的声音文件为:WAV文件、VOC文件、AU文件和MID文件。 (1) WAV声音文件格式:WAV文件是从模拟声波采样后得到的一种波形文件,使用于Windows操作系统,其格式是由文件首部与文件数据块组成。 (2) VOC声音文件格式:VOC文件是用于DOS操作系统下的一种波形文件。 (3) AU声音文件格式:用于UNIX操作系统下的一种波形文件。 (4) MID文件格式:MID文件是一种记录数字化音乐的MIDI文件。 四.音频信号的指标 1. 频带宽度:音频信号的频带越宽,所包含的音频信号分量越丰富,音质越好。 2.动态范围:动态范围越大,信号强度的相对变化范围越大,音响效果越好 。 3.信噪比:信噪比SNR(Signal to Noise Ratio)是有用信号与噪声之比的简称。 4.主观度量法:人的感觉机理对声音的度量最有决定意义。 声音的质量分为了五个等级,由低到高分别是:电话(telephone)、调幅广播(AM)、调频广播(FM)、光盘(CD)、数字录音带(DAT) 第2节? 音频数字压缩 一.音频压缩编码技术 主要有以下几种主要类型: 1.熵编码 :如Huffman编码、算术编码以及行程编码等。 3.参数编码 :参数编码的方法是将音频信号以某种模型表示,再抽出合适的模型参数和参考激励信号进行编码;声音重放时,再根据这些参数重建即可。此类方法构成声码器的有线性预测(LPC)声码器、通道声码器、共振峰声码器等。 4.混合编码 :音频中采用的混合编码包括多

文档评论(0)

报告论文库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档