第03章_数字音频基础.pdf

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第03章_数字音频基础

第三章 数字音频基础 音频是多媒体系统的重要组成部分,在音乐的衬托下图像或视频变得生动起来。在有些应 用场合中,声音更是具有关键作用。例如在多媒体通信应用中,音频处于核心地位,人们可以 容忍图像质量的下降,但是声音或者通话质量不好,则会极大地影响通信体验,这时声音比图 像更为重要。 本章首先介绍声音的物理概念,给出音频信号的基本特征和描述,然后介绍将模拟音频信 号转化成数字音频信号的关键技术,这就是采样与量化;接着重点介绍几种数字音频编码算法 的原理。 3.1 声音及其属性 3.1.1 声音的概念 声音是物体振动形成的机械波,称为声波。声波通过介质(例如空气、水等)传播到听觉 系统里产生听觉反应。当演奏乐器、拍打一扇门或者敲击桌面时,它们的振动都会引起介质—— 空气分子有节奏的振动,使周围的空气产生疏密变化,形成疏密相间的纵波,从而产生了声波。 声波会持续推进直到振动能量耗尽为止。所以,声音本质上是介质的周期振动。发声的物体叫 声源,介质的周期振动是声波,声波在听觉系统里产生的反应就是声音。声波是通过振动内耳 的听小骨转化为脑电波的,正是通过脑电波我们感觉到了声音。麦克风捕获声波、扬声器发声 的原理与内耳工作机制相似。 3.1.2 声音的基本属性 声音作为一种机械波,其基本物理属性是频率和振幅。频率指振动的快慢,通常用每秒钟 的振动次数表示 (赫兹)。人耳可以听到的声音频率范围在20 到2 万赫兹之间。高于这个范围 的波动称为超声波 (Ultrasonic ),而低于这一范围的称为次声波 (Subsonic )。我们把人类听觉 系统所能听到的声音称为音频(Audio )。据研究,狗和蝙蝠等动物可以听到高达16 万赫兹的声 音,而鲸鱼和大象则可以感觉到频率在15 到35 赫兹范围内的声音。 声音的振幅是指声波在某个位置上的瞬时强弱。振幅影响声音的大小,但声音的大小还与 听觉系统与声源的距离有关。从根本上讲,振幅是由声音能量的多少决定的,能量越大,对介 质的压力也越大,因此可以用声压来描述振幅。 有时候,人们用音高、音质和音强来描述声音的基本特征。实际上,这三个特征都归结为 频率和振幅这两个基本属性。其中音高、音质与频率相关。真相是这样的,通常听到的声波实 际上是不同频率、不同强度正弦波的叠加,傅立叶变换(Fourier Transform)揭示了这一现象的基 本特点。音高其实是由基波频率决定的,基波频率越高,声音听起来也就越高。而音质是由谐 波成份的分布结构决定的,谐波构成不同,就会有不同的音质;所以,不同乐器、不同人由于 其发声系统的材料与结构不同,因此所发出的声音的谐波成份就不同,所以音质也不同,即听 起来是不同的声音。 音强是指声音的强弱。前面已经提到,音强可以用声压大小表示。但是,若直接以声压值 表示声音强弱,会由于其变化范围太大,导致计算上的不方便,例如可以达到六个数量级以上。 同时由于人类听觉系统对声音信号强弱刺激反应不是线性的,而是成对数比例关系,所以人们 采用分贝来表达声音的强弱。所谓分贝,是指两个相同的物理量(例 A1 和 A0 )之比取以 10 为底的对数并乘以20 (或10 ),即N = 20lg(A1/A0) 。分贝符号为dB,它是一种无量纲的物理 量。式中 A0 是基准值 (或参考量),A 1 是被量度值。被量度值和基准值之比取对数,该对数 值称为被量度值的级。亦即用对数标度时,所得到的是比值,它代表被量度值比基准值高出 多少级。通常,我们以20 微帕斯卡(μPa)为基准值来度量其他声音的强弱,例如,火箭发 射时产生的声音压力是2000 帕斯卡,因此,其分贝值就是log20(2000/20x10-6) ,即160 分贝。 这么高的分贝值,可谓震耳欲聋。而一般图书馆、资料室里面的声响级别是40 分贝左右。 3.2 从模拟到数字 自然界的声音是一种模拟量,即连续变化的物理量。麦克风采集声音信号时首先得到的也 是连续变化的电压或电流。我们把用连续变化的电压或电流表示的音频信号,称为模拟音频信 号。但是,我们知道,现代多媒体系统处理的是数字音频信号,所以接下来介绍模拟音频信号 是如何转化成数字音频信号的,这是一个关键问题。 3.2.1 采样(Sampling) 采样是指以一定的频率(或周期)捕获模拟音频信号,从而得到一系列离散化音频样本的 过程。单位时间内捕获的样本个数称为采样频率(Sampling Rate)。常见的采样频率有44.1kHz 、 22.05

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档