语音信号处理第八章.ppt

  1. 1、本文档共120页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8章 语音编码 8.1 概述 8.2 语音编码的分类及特性 按编码方式语音编码分为三种: 波形编码 参数编码 混合编码 波形编码是将时间域或变换域信号直接变换为数 字信号,力求使重建语音波形保持原始语音信号的波 形形状。 要求重建语音信号 的各个样本尽可能地接近 原始语音信号s(n)的样本值,因此在波形编码中,信 噪比总是一个有用的性能评定标准。 脉冲编码调制PCM编码速率:64kbit/s 自适应增量调制ADM编码速率:32kbit/s-16kbit/s 自适应差分脉冲编码调制ADPCM编码速率:32kbit/s 8.2.2 参数编码 参数编码又称声码器编码,是将信源信号在频域或其它变换域提取特征参数,然后对这些特征参数进行编码和传输,在译码端再将接收到的数字信号译成特征参数,根据这些特征参数重建语音信号。 这种编码方法重建语音信号与原始语音信号样本之间没有一一对应关系。 合成语音的音质好坏需要借助于主观评定,缺少客观的评定标准。 参数编码优点: 编码速率低,且这类编码器对讲话环境噪声较敏感,需要安静环境才能给出较高的可懂度。 参数编码器有: 共振峰声码器 线性预测声码器 余弦声码器。 8.2.3 混合编码 二十世纪80年代产生混合编码。 优点:保留参数编码技术精华,并引用波形编码准则去优化激励源信号,克服了原有波形和参数编码的弱点,而吸取了它们各自的长处。 缺点:算法复杂、运算量很大。 编码速率:4kbit/s~16kbit/s 包括:多脉冲激励线性预测编码(MPELP) 码本激励线性预测编码(CELP) 8.2.4 语音压缩编码的依据 语音编码的目的: 在给定的编码速率下,使编解码后恢复出的重构语音的质量尽可能高。 提高语音编码效率的基本途径: 充分利用语音信号冗余度和人耳的听觉特性。 语音的冗余度主要来源于两个方面: 语音信号幅度分布的非均匀性; 语音样点之间的相关性。 语音信号幅度统计特性: 具有动态的、时变的、多维的暂态概率密度分布的随机过程。统计时间长度不同,它表现的概率密度分布形式不同。 一般长时(几十秒以上)统计幅度特性接近于gamma分布,短时(几到几十毫秒)统计幅度特性接近于高斯分布。 但无论哪种统计特性,语音信号总是小幅度出现概率大,大幅度出现概率小。 语音信号具有冗余度的另一原因:语音样点之间存在相关性。 利用语音信号的相关性,在时域上采用短时和长时预测,在频域上采用谱平整方法,可以达到压缩编码比特率的目的。 语音压缩编码的第二个途径是利用人耳的听觉特性。 人类听觉有一个特点: “听觉掩蔽效应”,是指一个强音能抑制一个同时存在的弱音的听觉。 听觉掩蔽效应在语音压缩编码中有非常重要的作用。 8.3 语音编码性能的评价指标 评价一个语音编码算法性能的基本指标包括: 编码速率、语音质量评价、编解码延时以及算法复杂度。 这四个因素之间有着密切的联系,在具体评价一种语音编码算法的优劣时,需要根据具体的实际情况,综合考虑四个因素进行性能评价。 8.3.1 编码速率 编码速率直接反映了语音编码对语音信息的压缩程度。度量方法有: “比特/秒”(bit/s) :代表编码的总速率,一般用I表示; “比特/样点”(bit//p):代表平均每个语音样点编码时所用的比特数,用R表示。 平均每样点比特数R越高,语音质量越容易提高,对传输带宽或存储容量要求也就越高。 降低编码速率是语音

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档