3.2音频数据的制作.docVIP

下载本文档

6
0
约1.2万字
约 23页
2017-08-10 发布于重庆
举报
版权申诉

3.2音频数据的制作.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

3.2音频数据的制作.doc

3.2 音频数据的制作 3.2.1 声音信号数字化声音是空气的振动而发出的，通常用模拟波的形式来表示。它有两个基本参数：振幅和频率。振幅反映声音的音量；频率反映声音的音调。频率在20Hz～20kHz的波称为音频波；频率小于20Hz的波称为次音波；频率大于20kHz的波则称为超音波。声音的质量是根据声音的频率范围来划分的：电话质量：200Hz～3.4kHz；调幅广播质量：50Hz～7kHz；调频广播质量：20Hz～15kHz；数字激光唱盘(CD-DA)质量：10Hz～20kHz。声波的包络线(envelope)是包裹整个波形的一条理想曲线。该曲线随着声音振幅的每个波峰发展。音频是连续变化的模拟信号，而计算机只能处理数字信号，要使计算机能处理音频信号，必须把模拟音频信号转换成用“0”、“1”表示的数字信号，这就是音频的数字化。音频的数字化涉及到采样、量化及编码等多种技术。 1. 采样音频是随时间变化的连续信号，要把它转换成数字信号，必须先按一定的时间间隔对连续变化的音频信号进行采样。一定的时间间隔T为采样周期，1/T为采样频率。根据采样定理：采样频率应大于等于声音最高频率的两倍。采样频率越高，在单位时间内计算机取得的声音数据就越多，声音波形表达得就越精确，而需要的存储空间也就越大。 2. 量化声音的量化是把声音的幅度划分成有限个量化阶距，把落入同一阶距内的样值归为一类，并指定同一个量化值。量化值通常用二进制表示。表达量化值的二进制位数称为采样数据的比特数。采样数据的比特数越多，声音的质量越高，所需的存储空间就越多；采样数据的比特数越少，声音的质量就越低，而所需的存储空间就越少。市场上销售16位的声卡(量化值的范围0～65536)，比8位的声卡(0～256)质量高。声音的存储量可用下式表示：式中：v为存储量；Fc为采样频率；B为量化位数；S为声道数 3. 编码计算机系统的音频数据在存储和传输中必须进行压缩，但是压缩会造成音频质量下降及计算量的增加。音频的压缩方法有很多，音频的无损压缩包括不引入任何数据失真的各种编码，而音频的有损压缩包括波形编码、参数编码和同时利用这两种技术的混合编码。波形编码方式要求重构的声音信号尽可能接近采样值。这种声音的编码信息是波形，编码率在9.6kbps～64kbps之间，属中频带编码，重构的声音质量较高。波形量化法易受量化噪音的影响，数据率不易降低。这种波形编码技术有PCM(脉冲编码调制)、DPCM(差分脉冲编码调制)、ADPCM(自适应差分脉冲编码调制)及属于频域编码的APC(自适应预测编码)、SBC(子带编码)、ATC(自适应变换编码)。参数编码以声音信号产生的模型为基础，将声音信号变换成模型后再进行编码。参数编码的参数有共振峰、线性预测(LPC)、同态等。这种编码方法的数据率低，但质量不易提高，编码率为0.8kbps～4.8kbps，属窄带编码。混合编码是把波形编码的高质量与参数编码的低数据率结合在一起的编码方式，可以在4.8kbps～9.6kbps的编码率下获得较高质量的声音。较成功的混合编码技术有：多脉冲线性预测编码(MPLPC)、码本激励线性预测编码(CELPC)和规则脉冲激励LPC编码(RPE—LPC) 等。 3.2.2 声音文件的格式和存储文本文件一样，存储声音数据也需要有存储格式。目前比较流行的以wav、au、aiff、snd 、rm、mp3、mid、mod等为扩展名的文件格式。wav格式主要用在PC上，au主要用在Unix工作站上，aiff和snd主要用在苹果机和美国视算科技有限公司(Silicon Graphics，Inc，SGI)的工作站上，rm和mp3是因特网上流行的音频压缩格式，mid、mod以*.MID命名的MIDI音频文件按MIDI数字化音乐的国际标准来记录和描述音符、音道、音长、音量和触键力度等音乐信息的指令。用wav为扩展名的文件格式称为波形文件格式(WAVE File Format)。波形文件格式支持存储各种采样频率和样本精度的声音数据，并支持声音数据的压缩。波形文件有许多不同类型的文件构造块组成，其中最主要的两个文件构造块是Format Chunk(格式块)和Sound Data Chunk(声音数据块)。格式块包含有描述波形的重要参数，例如采样频率和样本精度等，声音数据块则包含有实际的波形声音数据。RIFF中的其他文件块是可选择的。它的简化结构如图3–19所示。图3–19 WAVE文件结构为便于辨认文件的属性，表3–2列出了部分声音文件的类型。表3–2常见的声音文件文件扩展名说明 au Sun和NeXT公司的声音文件存储格式 aif(Audio Interchange) Apple计算机上的声音文件存储格式