- 1、本文档共70页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 音频信息处理技术 声音的概述 声音在本质上是一种机械振动 ,它通过空气传播到人耳,对人耳刺激后使大脑产生一种感觉。 声音三要素:音调、音色、响度 声音的频率范围 分贝 N = 10lg(A1/A0) A0是基准量(或参考量),A是被量度量。 所得到的是比值,它代表被量度量比基准量高出多少“级”。 如果以最高电平为参考量,那么得到的分贝数大多为负值,且0dB近似于系统能处理的最高电平。 3.1 基 本 概 念 1.听觉掩蔽 2.频谱掩蔽 3.瞬态掩蔽 (1) 失真的主观度量。 (2) 失真的客观度量。 声音客观质量主要用信噪比(Signal to Noise Ratio,SNR)来度量。无论对于任何音频产品,信噪比都是一个比较重要的参数,它指音源产生最大不失真声音信号强度的同时发出噪音强度之间的比率,通常采用S/N表示。一般用分贝(dB)为单位,信噪比越高表示音频质量越好。 5. 声道 为了确定声源位置, 大脑要将每个耳朵所听到声音的三个属性进行比较, 这三个属性分别是: (1) 幅值(Amplitude) (2) 相位(Phase) (3) 时序(Timing) 3.2 音频信号数字化 音频信息处理主要包括音频信号的数字化和音频信息的压缩两大技术 图3.2-1为音频信息处理结构框图。 (1) 采样:时间上离散化 下图是一个抽样概念示意图,假设一个模拟信号f(t)通过一个开关,则开关的输出与开关的状态有关,当开关处于闭合状态,开关的输出就是输入,即y(t)=f(t),若开关处在断开位置,输出y(t)就为零。 采样频率的选择与声音信号本身的频率之间有关,根据奈奎斯特(Nyquist)理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原为原来的声音。 按均匀的时间间隔T进行的。 常见的音频信号的频率范围如图3.2-2所示 (2) 量化:幅度离散化 均匀量化 量化噪声 非均匀量化 压缩扩张 非均匀量化 对y进行均匀量化,相当于对x进行非均匀量化,可提高小信号x的量化信噪比 采样与量化过程示例 图3.2-3 采样率为 1000 Hz、量化等级为 10的采样量化过程 图3.2-4 经过D/A转换器得到的信号波形有较大的失真 图 3.2-5 采样率为2000 Hz、量化等级为20的采样量化过程 图 3.2-6 采样率为4000 Hz、量化等级为40的采样量化过程 (3) 编码:用二进制数来表示每个采样的量化值 如果量化是均匀的, 又采用自然二进制数表示, 这种编码方法就是脉冲编码调制(Pulse Code Modulation, PCM)。 下图是脉冲编码调制的过程示意图。图(a)是一个以Ts为时间间隔的窄脉冲序列p(t),因为要用它进行抽样,所以称为抽样脉冲。在图(b)中,v(t)是待抽样的模拟电压信号,抽样后的离散信号k(t)的取值分别为k(0)=0.2,k(Ts)=0.4,k(2Ts)=1.8,k(3Ts)=2.8,k(4Ts)=3.6,k(5Ts)=5.1,k(6Ts)=6.0,k(7Ts)=5.7,k(8Ts)=3.9,k(9Ts)=2.0,k(10Ts)=1.2。 在图(c)中,对k(t)的取值进行量化(即四舍五入),得到m(t)。则m(t)的取值变为m(0)=0.0,m(Ts)=0.0,m(2Ts)=2.0,m(3Ts)=3.0,m(4Ts)=4.0,m(5Ts)=5.0,m(6Ts)=6.0,m(7Ts)=6.0,m(8Ts)=4.0,m(9Ts)=2.0,m(10Ts)=1.0,总共只有0、1、2、3、4、5、6等七个可能的取值。 对m(t)用3位二进制码元进行自然编码就得到图(d)的数字信号d(t),从而完成了A/D转换,实现了脉冲编码调制。 从上述抽样、量化、编码的PCM过程中没有发现明显的调制概念,那么为什么叫脉冲编码调制呢? 调制的概念 载波调制和脉冲调制 3.3 音频信号压缩编码 (1) 波形编码 (2) 参数编码 (3) 混合编码 3.3.1 增量调制 1.一般增量调制 增量调制也称△调制(delta modulation,DM),是一种比较简单且有数据压缩功能的波形编码方法,是PCM编码的一种特例。 用一位二进制数实现编码,DM编码系统又称为“1位系统” 。 增量调制的系统结构框图如图3.3-1所示。 在图3.3-2中, 纵坐标表示输入的模拟电压, 横坐标表示随时间增加而顺序产生的DM码。图中虚线表示输入的音频模拟信号。 “斜率过载” “散粒噪声” 2. 自适应增量调制(ADM) 基本方法:在检测到斜率过载时开始增大量化阶Δ,而在输入信号的斜率减小时降低量化阶Δ。 在ADM
您可能关注的文档
- 亲有过谏使更综述.ppt
- 第三章文化组织gengxin123分解.pptx
- 第三章文化组织分解.pptx
- 第三章文献检索分解.ppt
- 人_际_沟_通_培_训综述.ppt
- 第三章文字处理Word2003分解.ppt
- 第三章我国安全生产相关法律分解.ppt
- 第三章物流成本控制分解.pptx
- 第三章物流系统评价分解.pptx
- 第三章误差分析与处理分解.doc
- 10《那一年,面包飘香》教案.docx
- 13 花钟 教学设计-2023-2024学年三年级下册语文统编版.docx
- 2024-2025学年中职学校心理健康教育与霸凌预防的设计.docx
- 2024-2025学年中职生反思与行动的反霸凌教学设计.docx
- 2023-2024学年人教版小学数学一年级上册5.docx
- 4.1.1 线段、射线、直线 教学设计 2024-2025学年北师大版七年级数学上册.docx
- 川教版(2024)三年级上册 2.2在线导航选路线 教案.docx
- Unit 8 Dolls (教学设计)-2024-2025学年译林版(三起)英语四年级上册.docx
- 高一上学期体育与健康人教版 “贪吃蛇”耐久跑 教案.docx
- 第1课时 亿以内数的认识(教学设计)-2024-2025学年四年级上册数学人教版.docx
文档评论(0)