3.2.4声音媒体的采集与处理.ppt

下载文档

14
0
约6.93千字
约 64页
2016-01-14 发布于山西
举报
版权申诉
保障服务

3.2.4声音媒体的采集与处理.ppt

1、本文档共64页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

3.2.4声音媒体的采集与处理

2.4 声音媒体的采集与处理音频信号简介通常，音频信号用一种模拟的连续波形表示，具有频率、幅度两个基本参数，人耳能感知的声音频率大约在20～20000Hz之间，在这种频率范围里感知的声音幅度大约在0～120dB之间。人耳对不同频率的声音敏感程度是不一样的，中频段（3 kHz～5 kHz）最敏感，幅度很低的信号都能被人耳听到。低频区和高频区较不敏感，能被人耳听到的信号幅度比中频段要高得多。 2.4.1音频制作系统的硬件组成录音、混音或是其它音乐制作过程，都是基于音频制作系统所具有的硬件设备完成的，包括声音输入、输出和处理部件。声音输入部件主要是麦克风、录音机声音的输出部件有耳机、扬声机、扩音机、录音机等音频处理部件是声卡。麦克风也称话筒，用于采集声音信号，并将采集到的物理声波转换成电信号，传输到处理设备（计算机）中。声卡，也叫音频卡，是计算机进行声音处理的适配器。声卡可以把来自话筒、收录音机、激光唱机等设备的语音、音乐等声音变成数字信号交给电脑处理，并以文件形式存盘，还可以把数字信号还原成为真实的声音输出。音箱（扬声器）是将音频信号转换为声音（物理声波）的一种设备。音箱内自带的功率放大器对音频信号进行放大处理后由音箱本身回放发出声音。音频处理系统部件 2.4.2声音的数字化声音是一种纵波，为了使计算机能够处理这样的模拟信号，必须先将这种模拟波形转换成二进制的数字形式，形成数字声音信号后才能在计算机中使用。计算机中广泛应用的数字化声音文件有两类：一类是采集各种原始声音，经过数字化处理后得到的数字文件（也称为波形文件）；还有一类是专门用于记录乐器声音的MIDI文件。声音的数字化处理就是将模拟的(连续的)声音波形数字化(离散化)，包括采样、量化和编码三个过程。连续时间的离散化通过采样来实现，连续幅度的离散化通过量化来实现。采样采样指在有规律的时间间隔T内，对模拟信号进行检测和测量，抽取模拟信号的一个瞬时幅度值，如图所示。采样频率采样频率可以表示成f=1/T，即采样频率是对声音波形每秒钟进行采样的次数。人耳听觉的频率上限在20kHz左右，根据采样理论，为了保证声音不失真，采样频率应在40kHz左右。采样频率越高，所获得的波形越接近于实际波形，声音保真度越高，但音频数据量也越大。经常使用的采样频率有11.025kHz（低品质）、22.05kHz（适用于语音和中等品质的音乐）和44.1kHz（用于CD品质的音乐）等。量化量化过程是把采样幅值归并到有限的幅度等级上，将其表示成一个离散振幅值的集合。量化精度量化精度由量化样本的位数（量化比特，bit per sample)衡量，分为8bit、16bit和32bit。8bit的量化位数每个采样点可以表示256个(0--255)不同量化值， 16bit的量化位数则可以表示为216,即65536个不同的量化值。量化位数越高音质越好，数据量也越大。编码编码是将量化后的整数值用二进制数来表示。采样频率越高，量化数越多，编码用的二进制位数也就越多，数字化的信号越能逼近原来的模拟信号，但音频数据量也越大。在编码过程中通常采用一定的算法来压缩数字数据以减少存贮空间和提高传输效率，因此不同的编码方法会形成不同的数字声音文件格式。 MIDI（Musical Instrument Digital Interface）是音乐设备数字接口缩写。这种接口技术的作用就是使电子乐器与电子乐器，电子乐器与电脑之间通过一种通用的通讯协议进行通讯，是数字音乐的国际标准。 MIDI声音与数字化波形声音完全不同，它不是对声波进行采样、量化和编码，而是将电子乐器的弹奏过程记录为一连串数字，例如用什么乐器如按了哪一个键、力度多大、时间多长等等。然后由声卡上的声音合成器根据这些数字所代表的意义合成音乐，再通过音箱或耳机播放。所以MIDI文件实际上是一种字符表格，它描述了各种音符以及这些音符的播放方式及时延的乐谱。 2.4.3 音频文件的格式存储声音信息的文件格式主要有：WAV文件、MIDI文件、MP3、VOC文件、AIF文件、RMI文件以及SNO文件等。 1. WAV文件 WAV文件，是Microsoft公司开发的一种波形文件格式，是Windows本身存放数字声音的标准格式，采用“.wav”作为扩展名。利用该格式记录的声音文件能够和原声基本一致，质量非常高，但由于WAV格式存放的一般是未经压缩处理的音频数据，所以体积都很大（1分钟的CD音质需要10M字节），不适于在网络上传播。 2. MP3文件 MP3的全称是MPEG-1 Audio Layer 3，是一种以高保真为前提下实现的高效压缩技术。MPEG音频文件的压缩是一种有损压缩，MPEG3