[文学]第3章_音频处理技术2课时.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[文学]第3章_音频处理技术2课时

第3章 音频处理技术 3.1 基本概念 3.2 音频数据采样与简单处理 3.3 数字音频处理软件GoldWave 3.1 基本概念 声音是振动的波,是随时间连续变化的物理量。 声音有三个重要指标: 振幅(Amplitude)——波的高低幅度,表示声音的强弱; 周期(Period)——两个相邻波之问的时间长度; 频率(Frequency)——每秒钟振动的次数,以Hz为单位。 用声音录制软件记录的英文单词“Hello”的语音实际波形 3.1.1 声音基本特点 1.声音的传播与可听域 2.声音的方向 3.声音的三要素 4.声音的频谱 5.声音的质量 6.声音的连续时基性 7.数字化声音 1.声音的传播与可听域 声音依靠介质的振动进行传播。声源实际上是一个振动源,它使周围的介质(空气、液体、固体)产生振动,并以波的形式进行传播,人耳如果感觉到这种传播过来的振动,再反映到大脑,就意味着听到了声音。 人耳听到的声音是有限的,频率低于20Hz和高于20kHz的声音人类听不到,换言之,人耳的可听域在20~20kHz之间。频率低于20Hz的声音叫做“次声”,高于20kHz的声音是“超声”。 频率范围又叫“频域”或“频带”,不同种类的声源其频带也不同,表3.l列出了部分常见声源的频带宽度。 2.声音的方向 声音以振动波的形式从声源向四周传播,人类在辨别声源位置时,首先依靠声音到达左、右两耳的微小时间差和强度差异进行辨别,然后经过大脑综合分析而判断出声音来自何方。 3.声音的三要素 声音的三要素是音调、音色和音强。就听觉特性而言,声音质量的高低主要取决于该三要素。 (1)音调——代表了声音的高低。音调与频率有关,频率越高,音调越高,反之亦然。 (2)音色——具有特色的声音。 声音分纯音和复音两种类型。所谓纯音,是指振幅和周期均为常数的声音;复音则是具有不同频率和不同振幅的混合声音,大自然中的声音大部分是复音。在复音中,最低频率的声音是“基音”,它是声音的基调。其他频率的声音称为“谐音”,也叫泛音。基音和谐音是构成声音音色的重要因素。 各种声源都具有自己独特的音色,例如各种乐器的声音、每个人的声音、各种生物的声音等,人们就是依据音色来辨别声源种类的。 3.声音的三要素(续) (3)音强——声音的强度,也被称为声音的响度,常说的“音量”也是指音强。音强与声波的振幅成正比,振幅越大,强度越大。唱盘、CD激光盘以及其他形式声音载体中的声音强度是一定的,通过播放设备的音量控制,可改变聆听时的响度。如果要改变原始声音的音强,在把声音数字化以后,使用音频处理软件提高音强。 4.声音的频谱 声音的频谱有线性频谱和连续频谱之分。 线性频谱是具有周期性的单一频率声波; 连续频谱是具有非周期性的带有一定频带所有频率分量的声波。 5.声音的质量 声音的质量简称“音质”,音质的好坏与音色和频率范围有关。悦耳的音色、宽广的频率范围,能够获得非常好的音质。影响音质的因素还有很多,常见的有: (1)对于数字音频信号,音质的好坏与数据采样频率和数据位数有关。采样频率越低,位数越少,音质越差。 (2)音质与声音还原设备有关,音响放大器和扬声器的质量能够直接影响重放的音质。 (3)音质与信号噪声比有关。在录制声音时,音频信号幅度与噪声幅度的比值越大越好,否则声音被噪声干扰,会影响音质。 6.声音的连续时基性 声音在时间轴上是连续信号,具有连续性和过程性,属于连续时基性媒体形式。 7.数字化声音 为了用计算机表示和处理声音,必须将声音进行数字化,即用数字表示声波。 数字化了的声音叫做“数字音频信号”,它除了包含有自然界中所有的声音之外,还具有经过计算机处理的独特的音色和特质 3.1.2 数字音频文件的种类 1.WAV文件 2.MIDI文件 3.光盘数字音频文件(CD-DA) 4. 压缩音频文件 5.其他文件格式 1.WAV文件 WAV文件也称为波形文件,是Windows所使用的标准数字音频,文件的扩展名是WAV。 它是对实际声音进行采样所得到的数据。 使用波形文件最大的缺点是文件太大,不适合长时间记录声音,例如,同样半小时的立体声音乐,MIDI文件只有200KB左右,而WAV文件则要差不多300MB。 波形音频文件占存储空间很大,每秒钟音频文件的字节数可用如下公式计算: (采样频率×采样精度)/8 2.MIDI文件 MIDI是Musical Instrument Digital Interface (乐器数字接口)的缩写,MIDI文件的扩展名为MID。 与波形文件不同,MIDI文件不对音乐进行采样,而是对音乐的每个音符记录为一个数字,所以与波形文件相比要小得多,可以满足长时间音乐的需要。 MIDI标准规定了各种音调的混合及发音,通过输出装置可以将

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档