如何处理声音技术 (2).ppt

下载文档

4
0
约2.95千字
约 21页
2017-05-29 发布于四川
举报
版权申诉
保障服务

如何处理声音技术 (2).ppt

1、本文档共21页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第2章音频处理技术西安交通大学计算机教学实验中心简述音频是多媒体技术中媒体的一种，由于音频信号是一种连续变化的模拟信号，而计算机只能处理和记录二进制的数字信号，因此，音频信号必须经过一定的变化和处理，变成二进制数据后才能送到计算机进行编辑和存储。声音的基本特性音频信号所携带的信息大体上可分为语音、音乐和音响三类。语音是指具有语言内涵和人类约定的特殊媒体; 音乐是规范的符号化了的声音; 音响指其他自然声音，如动物的叫声、机器的轰鸣声、风雨雷电声等; 音频信号的特征声音机械振动产生声波。声波可以用一条连续的曲线来表示，它在时间和幅度上都是连续的，称为模拟音频信号。声音的物理特性频率/带宽单位时间内声源振动的次数或空气中气压疏密变化的次数，称为声源的频率f，单位赫兹(Hz) 频带宽度或称之为带宽，它描述组成复合信号的频率范围频谱乐器很少产生单一频率的纯音，而是复音。复音的产生基于物体的复杂振动，可以分解为许多不同振幅和不同频率的简谐振动(即看成简谐振动的叠加)。简谐振动的振幅按频率排列的图形称为频谱。频谱可一目了然地看出复杂振动的频率结构。音频信号的质量指标频带宽度音频信号所包含的谐波分量越丰富，音色越好。在广播通信和数字音响系统中，以声音信号所包含的谐波分量的频率范围来衡量声音的质量，即带宽。声音的数字化数字化就是将连续信号变成离散信号。对音频信号，首先在时间上离散，取有限个时间点，称为采样。然后在幅度上离散，取有限个幅度值，称为量化。再将得到的数据表示成计算机能够识别的格式，称为编码。 PCM编码量化位数数字音频的技术指标采样频率采样频率是指一秒钟采样的次数。采样频率越高，单位时间内采集的样本数越多，得到波形越接近于原始波形，音质就越好。根据奈奎斯特(Harry Nyquist)采样理论：如果采样频率高于输入信号最高频率的两倍，重放时就能从采样信号序列无失真地重构原始信号。例如，话音的信号频率约为3.4 kHz，若采样频率选为8kHz，就能无失真地重放原始声音。常用采样频率 11.025kHz——AM广播 22.05kHz ——FM广播 44.1kHz ——CD高保真音质声音现在声卡的采样频率一般为48kHz甚至96kHz。采样精度采样精度用每个声音样本的位数表示，也叫样本精度或量化位数。它反映度量声音波形幅度的精度。例如，每个声音样本用16位表示，则量化样本值在0～65535的整数范围内，它的精度是输入信号的1/65536 采样精度影响到声音的质量位数越多，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。声道数单声道(mono)信号一次产生一组声波数据。如果一次产生两组声波数据，则称其为双声道或立体声(stereo)。双声道在硬件中占两条线路，一条是左声道，一条是右声道。立体声不仅音质、音色好，而且能产生逼真的空间感。但立体声数字化后所占空间比单声道多一倍。音频数据传输率音频信号数字化后，产生大量数据产生数据的速度或播放声音时需要传输数据的速度影响声音的播放质量。数据传输率用每秒钟传输的数据位数表示，记为bps（bit per second）。未经压缩的数字音频数据传输率为: 数据传输率(bit／s)=采样频率(Hz)×量化位数(bit)×声道数例高保真立体声数字音频的量化位数为16，试计算其数据传输率解：高保真立体声数字音频采样频率为44.1kHz，双声道，其数据传输率为数据传输率=44.1(kHz)×16(bit)×2(channel)=1411.2(kbps) 如果采用PCM编码，数字音频文件所占用的空间可用如下的公式计算：音频数据量（Byte）=数据传输率×持续时间／8(bit/Byte) 其中数据量以字节(Byte)为单位；数据传输率以每秒比特(bps)为单位；持续时间以秒(s)为单位。例计算1分钟未经压缩的高保真立体声数字声音文件的大小。解：高保真立体声数字音频采样频率为44.1kHz，16位量化，双声道，其数据传输率为：数据传输率=44.1(kHz)×16(bit)×2(channel)=1411.2(kbps) 1分钟这样的声音文件的大小为音频数据量=1411.2（kb/s）×60（s）/8(bit/Byte)=10584kB 未经压缩的4分钟的歌曲文件约42M数据. 数字音频文件格式数字声音文件格式是数字音频在磁盘文件中的存放形式，相同的数据可以有不同的文件格式，而不同的数据也可以有相同的文件格式. WAVE文件格式 WAVE文件是一种通用的音频数据文件，文件扩展