语音信号处理 第4版 课件 第9章:语音编码.pptx

语音信号处理 第4版 课件 第9章:语音编码.pptx

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

南京邮电大学通信与信息工程学院第9章语音编码

目录1语音编码的评价指标3语音信号的参数编码5基于深度学习的语音编码2语音信号的波形编码4语音信号的混合编码

9.1语音编码的评价指标—语音编码的依据语音信号中存在着冗余度(包括时域与频域),人的听觉感知机理也有很多可以利用的特点。语音信号压缩编码之所以可行,正是因为这两种情况的存在。语音编码的依据之一:语音信号冗余度基本时域冗余:(1)语音信号幅度非均匀分布性(2)语音信号样本间的强相关性(3)浊音语音段具有的准周期性(4)声道形状及其变化的缓慢性(5)静止系数(即语音间隙性)基本频域冗余:(1)从长时间的功率谱密度来看,语音信号具有强烈的非平坦型,存在着固定的冗余度。而且高频能量通常较低,恰好对应于时域上的相邻样本相关性。(2)从短时功率谱密度来看,语音信号在不同频率交替出现峰值(共振峰)与谷值。整个功率谱的细节基于基音频率形成高次谐波结构。语音编码的依据之二:人的听觉特点(1)人类听觉系统存在着掩蔽系统,即高声级单音会明显掩蔽临近频率声音。(2)对于不同频段的声音,人耳的敏感程度不尽相同。(3)人类对于语音信号的周期性(即音调)极为敏感,但对信号的相位却充耳不闻,这与理论分类存在差异。长时功率谱密度短时功率谱密度

9.1语音编码的评价指标—语音编码系统的评价标准较为重要的性能评价指标(1)编码速率(比特率),决定了编码器工作时占用的信道带宽,要求尽可能降低。(2)编码器的完健性,要求良好。(3)编码器的时延,要求最小化。(4)误码容限,要求保持较高值。(5)算法复杂度(包括运算复杂度与内存要求),影响硬件成本,尽可能降低。(6)算法可扩展性,越高越好。

9.1除了以上提到的客观指标,语音质量是衡量语音编解码技术的关键指标。其按照评测方法可分为两大类:主观评价和客观评价。语音编码的评价指标—语音编码系统的评价标准

目录1语音编码的评价指标3语音信号的参数编码5基于深度学习的语音编码2语音信号的波形编码4语音信号的混合编码

9.2语音信号的波形编码—概述波形编码:波形编码是语音编码系统在早期所广泛采用的方法,它把语音信号当成普通的波形信号来处理从而保持原波形形状。波形编码适应能力强,合成语音质量好,但比特率过高,编码的效率也不尽如人意。几种典型的波形编码:(1)脉冲编码调制(PCM)(2)自适应预测编码(3)自适应增量调制(ADM)(4)自适应差分脉冲编码调制(ADPCM)(4)子带编码(SBC)

9.2语音信号的波形编码—脉冲编码调制形式一:均匀PCM最简单最原始的波形编码方式,没有运用压缩技术,产生的比特率也极高,故在当今运用极少。形式二:非均匀PCM将信号进行非线性变换后再均匀量化,变换后信号具有均匀概率密度分布。编码时常采用对数变换压缩(译码时指数扩展)。采用非线性压缩扩张的非均匀量化器

9.2语音信号的波形编码—脉冲编码调制μ律压缩扩张技术(应用于北美、日本)A律压缩扩张技术(应用于其他国家与地区)

9.2语音信号的波形编码—脉冲编码调制??匹配自适应G匹配自适应两种自适应方法的原理图

9.2语音信号的波形编码—脉冲编码调制按自适应参数来源划分(以?为例)前馈自适应反馈自适应其中,有且或

9.2语音信号的波形编码—自适应预测编码基本的自适应预测编码系统根据信号量化噪声比的定义:是由量化器决定的信噪比,而反映了线性预测带来的增益,称为预测增益。由此可知,引入线性预测之后,SNR将得到改善。

9.2语音信号的波形编码—自适应增量调制自适应增量调制(ADM):增量调制(DM)的基本方案:增量调制方式将下一个语音信号与当前语音信号比较,如果高与当前值则系统则编码1,否则系统编码0。自适应增量调制(ADM)的工作方式:自适应增量调制随输入波形自适应的改变量化阶梯的大小,在信号平均斜率大时自动增大量化阶梯,反之减小。

9.2语音信号的波形编码—自适应差分脉冲编码调制自适应差分脉冲编码调制(ADPCM):差分脉冲编码调制(DPCM):不同于DM的一位编码,DPCM多位量化对两个采样之间的差分信号利用多位量化进行编码,使信息量得到压缩的同时降低了信道负载。DPCM结构框图

9.2语音信号的波形编码—自适应差分脉冲编码调制但采用固定的高阶预测,改善效果并不明显,于是,高阶自适应预测作为相应的解决方式被提出,自适应预测器随着语音特征变化不断更新预测系数,从而获得更高

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档