- 1、本文档共73页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]chap2音频处理技术
引言 音频是一种非常重要的媒体。 计算机只能处理数字信号,而音频信号是模拟信号。 必须对音频信号进行处理。 音频信号处理包括数据采样和编辑加工两个方面。 第二章 音频处理技术 2.1声音的基本特性 音频信号所携带的信息大体上可分为三类: 语音:具有语言内涵 音乐:规范化的符号化的声音。 音响:其它自然声音 均匀量化 采用相等的量化间隔对采样得到的信号作量化,称为均匀量化。 无论对大的输入信号还是小的输入信号均采用相同的量化间隔。 但是对话音信号来说,大信号出现的机会并不多,增加的样本位数没有得到充分的应用。 非均匀量化 大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔。 在满足精度要求的情况下用较少的位数来表示,声音数据还原时,采用相同的规则。 在非均匀量化中,一般采用两种算法: μ律压扩算法 A律压扩算法 μ律压扩算法 主要用在北美和日本等地区的数字电话通讯中。 其中:sgn(x)表示x的极性(正负), μ表示最大量化间隔和最小量化间隔之比。 ?律压扩输入和输出关系图 主要用在欧洲和中国大陆等地区的数字电话通讯中。 0 ? |x| ? 1/A 1/A |x| ? 1 其中:sgn(x)表示x的极性(正负), A表示最大量化间隔和最小量化间隔之比,一般取87.56。 A律压扩算法 对于采样频率为8KHz,样本精度为13、14、16位的输入信号,使用?律压扩或A律压扩编码,经过PCM编码器之后每个样本需要8位二进制存储,输出的数据传输率为64Kb/s,这其实就是CCITT推荐的G.711标准:话音频率脉冲编码调制。 (CCITT:International Telephone and Telegraph Consultative Committee,国际电话与电报顾问委员会) 举例 声音的数字化过程:采样、量化、编码三个阶段。 采样频率 量化位数 编码方法 数字音频的技术指标 每秒采样的次数。 采样频率越高,得到的波形越接近于原始波形,音质就越好。 奈奎斯特理论:如果采样频率高于输入信号最高频率的两倍,重放时就能从采样信号无失真的重构原始信号。 AM/FM/CD:采样频率分别为11.025/22.05/44.1 KHz 采样频率 每个声音样本的位数,也称为样本精度、量化位数。它发音度量声音波形幅度的精度。 采样精度决定了模拟信号数字化以后的动态范围。 采样精度影响声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。 采样精度 单声道:一次产生一组声波数据;如果一次产生两组声波数据,则称为双声道或者立体声。 立体声的音质、音色比较好,而且能够产生逼真的空间感,但是立体声数字化后所占的存储空间比较大。 影响声音质量的因素除了采样频率、采样精度、声道数以外,还包括环境噪声、声卡内部的噪声、采样数据丢失以及音响的质量。 声道数 音频数字化后的数据文件大小直接受限于存储空间。 产生数据的速度或播放声音时需要传输数据的速度影响声音的播放质量。 数据传输率:每秒钟传输的数据位数,记为b/s。未经压缩的数据传输率为: 数据传输率(b/s)=采样频率(Hz)×量化位数(b)×声道数 音频数据传输率 声音质量和数字化指标 1.高保真立体声数字音频的量化位数为16位,计算其数据传输率? 2.计算一分钟未经压缩的高保真立体声数字声音文件的大小? 讨论: 音频文件很大,如何降低声音数据文件的大小? 举例 音频数据量大,因此在编码的时候常常要采用压缩的方式。 编码的作用:记录数字数据、采用一定的算法来压缩数据以减少存储空间和提高传输率。 压缩比是压缩编码的基本指标: 编码算法与音频数据压缩比 采用不同的数字化指标实际上也是进行了不同比例的数据压缩。 压缩比越大,丢掉的信息可能就会越多,信号还原后失真就越大。 压缩算法包括有损压缩和无损压缩。详见2.5节。 编码算法与音频数据压缩比(续) 数字音频文件格式是指数字音频在磁盘文件中的存放形式。 相同的数据可以有不同的文件格式,而不同的数据也可以有相同的文件格式。 常用的文件格式包括WAVE、MP3、RA等格式。 数字音频文件格式 一种通用文件格式,扩展名为*.wav,windows系统和一般的音频卡都支持这种格式。 Wave文件包括三个部分:文件头、数字化参数、实际波形数据。 CD激光唱盘中的数据实际就是WAVE格式的数据,但扩展名未标明为wav。 W
文档评论(0)