声音和语音编码.ppt

  1. 1、本文档共98页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
声音和语音编码

南通大学计算机应用教研室 第二章 声音和语音编码 本章主要内容 声音概述 声音的数字化 电子合成音乐 语音编码 脉冲编码调制(PCM) PCM应用 其它编码方法 2.1 声音概述 声音是一种连续的波,具有普通波的一切特性:反射、折射、衍射等。 声音信号是由许多频率不同的信号组成 声波的分类(按频率) 次声波 ( 0 ~ 20 Hz ) 声波 (20 ~ 20 KHz) — 人类听觉范围 超声波 ( 20KHz ) — 强的方向性 应用:B超、探测仪、主动声纳 2.1 声音概述(续) 声音的幅度 人类能够感知的范围是:0~120dB之间 超出120dB人耳可能会感动疼痛 补充:什么是dB(分贝)数? 什么是dB(分贝)数? 一种相对量单位,在专业音响设备的调节刻度上经常会遇到,例如增益大小、衰减量、提升量、电平量等。 其定义是:dB数=20lgA/B 但在功率级、声强级及能量级中,其定义是:dB数=10lgA/B 式中,A是被比较的绝对量,例如电压、电流等;B为比较的标准量。 采用dB数表示量值的优点是缩小了数值大小,使量值表示更简单更具体,使运算简化。同时,对一些变化范围很宽的物理量作图表示或刻度与非常方便,一目了然。 2.1 声音概述(续) 音宽与频带:频带宽度或称为带宽,它是描述组成复合信号的频率范围。 2.1.1 音频信号的指标 一. 频带宽度:音频信号的频带越宽,所包含的音频信号分量越丰富,音质越好。 2.1.1 音频信号的指标 (续) 二.动态范围: 动态范围越大,信号强度的相对变化范围越大,音响效果越好。 2.1.1 音频信号的指标 (续) 三.信噪比:信噪比SNR(Signal to Noise Ratio)是有用信号与噪声之比的简称。噪音可分为环境噪音和设备噪音。信噪比越大,声音质量越好 本章主要内容 声音概述 声音的数字化 电子合成音乐 语音编码 脉冲编码调制(PCM) PCM应用 其它编码方法 2.2 声音的数字化 模拟信号与数字信号 声音信号的数字化 采样频率 采样精度 声音质量与数据率 2.2.1 模拟信号与数字信号 模拟信号——时间上、幅度上均连续的 信号。 采样—— 在某一时刻对模拟信号的幅度进行测量,将其时间上离散化 量化—— 将采样得到的信号幅度的取值离散化。如采样得到的幅度为[0,255],一种离散化的方法是取值{0,1,2,…,255} 采样和量化后得到的信号就是数字信号 2.2.1 模拟信号到数字信号 为什么要从模拟信号过渡到数字信号? 以前声音长途传输用电信号来模拟声波,对电信号的处理,采用模拟电气元件,受环境影响很大(温度、电磁场干扰),难以纠错。 采用数字信号,采用数字信号处理器(DSP)进行数学运算,受环境影响较小,可以实现容错处理。 2.2.1 数字信号处理的优点 数字信号计算是一种精确的计算方法,不受时间和环境变化的影响; 用数学运算来实现(模拟)原来的物理部件的功能相对比较容易 可以通过改变数学运算的方法,实现不同的功能,而不需更换物理部件(DSP)。即只需对DSP编程。 2.2.2 声音信号的数字化 声音信号的数字化步骤: 采样 ——得到一个个时间上离散的幅度值 量化 ——得到一个个离散的幅度值 连续时间的离散化通过采样,一般采用均匀采样(uniform sampling) 连续幅度的离散化通过量化,可采用线性量化, 或非线性量化 2.2.2 声音信号的数字化 (图) 采样和量化——示例 如有一声音信号,对其进行采样和量化。 量化表用 [1,2,3,4,5,6,7,8] ,四舍五入方法。 结果如下表2.2 2.2.2声音信号的数字化 目前应用较为广泛的采样方式: 奈奎斯特(Nyquist)采样 正交采样 带通采样 Sigma-Delta(∑-△)采样等 2.2.2 声音信号的数字化 需要解决的两个问题: 采样频率应该是多少? 量化的精度?bps(bit per sample) 2.2.3 采样频率 采样频率是指一秒钟内采样的次数。 奈奎斯特采样定理(Nyquist theory): 如果对某一模拟信号进行采样,则采样后可还原的最高信号频率只有采样频率的一半; 或者说只要采样频率高于输入信号最高频率的两倍,就能从采样信号系列重构原始信号。 2.2.3 采样频率 奈奎斯特采样定理: fs = 2 fmax -- fs为采样频率,fmax为信号最高频率 对声音信号而言,fmax为声音信号的最高频率。 在实际应用中,为了使前级抗混叠滤波器易于实现,提高输入信号的信噪比,一般fs取fmax的2.5倍以上。 2.2.3 采样频率

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档