第二章声音和语音编码.ppt

下载文档 降价啦

7
0
约1.11万字
约 98页
2017-02-13 发布于天津
举报
版权申诉
保障服务

第二章声音和语音编码.ppt

1、本文档共98页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第二章声音和语音编码

南通大学计算机应用教研室第二章声音和语音编码本章主要内容声音概述声音的数字化电子合成音乐语音编码脉冲编码调制（PCM） PCM应用其它编码方法 2.1 声音概述声音是一种连续的波，具有普通波的一切特性：反射、折射、衍射等。声音信号是由许多频率不同的信号组成声波的分类（按频率）次声波 ( 0 ～ 20 Hz ) 声波 (20 ～ 20 KHz) — 人类听觉范围超声波 ( 20KHz ) — 强的方向性应用：B超、探测仪、主动声纳 2.1 声音概述（续）声音的幅度人类能够感知的范围是：0～120dB之间超出120dB人耳可能会感动疼痛补充：什么是dB（分贝）数？什么是dB（分贝）数？一种相对量单位，在专业音响设备的调节刻度上经常会遇到，例如增益大小、衰减量、提升量、电平量等。其定义是：dB数=20lgA/B 但在功率级、声强级及能量级中，其定义是：dB数=10lgA/B 式中，A是被比较的绝对量，例如电压、电流等；B为比较的标准量。采用dB数表示量值的优点是缩小了数值大小，使量值表示更简单更具体，使运算简化。同时，对一些变化范围很宽的物理量作图表示或刻度与非常方便，一目了然。 2.1 声音概述（续）音宽与频带：频带宽度或称为带宽，它是描述组成复合信号的频率范围。 2.1.1 音频信号的指标一. 频带宽度：音频信号的频带越宽，所包含的音频信号分量越丰富，音质越好。 2.1.1 音频信号的指标 (续) 二．动态范围: 动态范围越大，信号强度的相对变化范围越大，音响效果越好。 2.1.1 音频信号的指标 (续) 三．信噪比：信噪比SNR（Signal to Noise Ratio）是有用信号与噪声之比的简称。噪音可分为环境噪音和设备噪音。信噪比越大，声音质量越好本章主要内容声音概述声音的数字化电子合成音乐语音编码脉冲编码调制（PCM） PCM应用其它编码方法 2.2 声音的数字化模拟信号与数字信号声音信号的数字化采样频率采样精度声音质量与数据率 2.2.1 模拟信号与数字信号模拟信号——时间上、幅度上均连续的信号。采样—— 在某一时刻对模拟信号的幅度进行测量，将其时间上离散化量化—— 将采样得到的信号幅度的取值离散化。如采样得到的幅度为[0,255],一种离散化的方法是取值{0,1,2,…,255} 采样和量化后得到的信号就是数字信号 2.2.1 模拟信号到数字信号为什么要从模拟信号过渡到数字信号？以前声音长途传输用电信号来模拟声波，对电信号的处理，采用模拟电气元件，受环境影响很大（温度、电磁场干扰），难以纠错。采用数字信号，采用数字信号处理器（DSP）进行数学运算，受环境影响较小，可以实现容错处理。 2.2.1 数字信号处理的优点数字信号计算是一种精确的计算方法，不受时间和环境变化的影响；用数学运算来实现（模拟）原来的物理部件的功能相对比较容易可以通过改变数学运算的方法，实现不同的功能，而不需更换物理部件(DSP)。即只需对DSP编程。 2.2.2 声音信号的数字化声音信号的数字化步骤：采样 ——得到一个个时间上离散的幅度值量化 ——得到一个个离散的幅度值连续时间的离散化通过采样，一般采用均匀采样(uniform sampling) 连续幅度的离散化通过量化，可采用线性量化, 或非线性量化 2.2.2 声音信号的数字化 (图) 采样和量化——示例如有一声音信号，对其进行采样和量化。量化表用 [1，2，3，4，5，6，7，8] ，四舍五入方法。结果如下表2.2 2.2.2声音信号的数字化目前应用较为广泛的采样方式: 奈奎斯特(Nyquist)采样正交采样带通采样 Sigma-Delta(∑－△)采样等 2.2.2 声音信号的数字化需要解决的两个问题：采样频率应该是多少？量化的精度？bps(bit per sample) 2.2.3 采样频率采样频率是指一秒钟内采样的次数。奈奎斯特采样定理(Nyquist theory): 如果对某一模拟信号进行采样，则采样后可还原的最高信号频率只有采样频率的一半；或者说只要采样频率高于输入信号最高频率的两倍，就能从采样信号系列重构原始信号。 2.2.3 采样频率奈奎斯特采样定理: fs = 2 fmax －－ fs为采样频率，fmax为信号最高频率对声音信号而言，fmax为声音信号的最高频率。在实际应用中，为了使前级抗混叠滤波器易于实现，提高输入信号的信噪比，一般fs取fmax的2.5倍以上。 2.2.3 采样频率