1. 1、本文档共85页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
LPC滤波器滤波之后,下一步要对这160个剩余(LPC)抽样进行处理。该处理将抽样分为4个子帧处理,每个子帧40个抽样。对于每个子帧都要查找其对应的LTP增益和延迟(根据讲话者年龄和性别的不同,基音的范围在57Hz到400Hz之间,其变化比声道要快)。 LTP滞后和增益以子帧为单位编码并传送。剩余信号将减去对应40个抽样子帧的LTP结果。这个差分信号要通过RPE过程编码,事实上该过程已经将40个抽样的差分信号分成了4个子序列(第一个序列下标从0、3一直到36:第二个从1、4一直到37;第三个从2、5一直到38;最后一个从3、6一直到39,即子帧的最后一个下标)。 这样就产生了一种“奇怪的”三分之一子抽样处理(硬低通滤波器,截频在1300Hz左右),实际上让男性的声音超过了女性或者儿童的声音。最接近原始40个剩余抽样的子序列被选择——每个子帧需要用两个比特来标识。然后将所选择子序列的最大能量找出并 比特率 = 260/20ms = 13 kbit/s 260 总计 8 LTP增益 = 2比特 28 LTP滞后 = 7比特 156 13个抽样的标量量化 = 13x3 = 39比特 24 所选择序列的最大能量 = 6比特 8 栅格选择 = 2比特 子帧长度= 40个抽样 = 5ms (4个子帧) 36 声道:LPC系数:8个自相关系数 = 36比特 RPE-LTP帧长度 = 160个抽样 = 20ms 编码为6个比特。子序列的所有抽样通过这个被量化和逆量化的能量进行规一化,然后将所有规一化的抽样标量化为3个比特。 表6-9 GSM RRPE-LTP语音编码器一帧的比特分配 四、代码激励线性预测(CElP)编码器 CELP编码器本质上是线性预测编码器,但是它配备了ABS查找过程。线性预测编码器的主要问题是,在利用LPC滤波器消除了短期相关性之后,长期相关性(或音调影响)就能有效模拟激励信号。CELP的复杂性要低一些,但可能会更有效(包括比特率)。 在CELP编码器中,建立了一个基于向量量化的代码本(在一个大型“语音”数据库上训练和优化),其中的向量作为LTP和LPC合成滤波器的发生器。按照感觉错误规则,最接近输入信号的激励信号(在代码本中以增益为索引)将会被选择。CELP在某种意义上也是波形编码器,因为它试图“跟踪”输入信号的瞬时波形。 图6-27 CELP编码器的基本框图 语音整个帧的LPC系数先要被计算和量化。向量量化和线谱对由于它们的高效率而使用得越来越多。LTP滞后和增益以子帧为单位被检索和量化,包括代码本索引和相关增益Gi。 解码器的复杂度比编码器要小(没有ABS检索程序),而且可以包含一个可选的后置滤波器(post filter),如图6-28所示。 图6-28 CELP解码算法的基本概念 五、1TU-T 8kbit/s CS-ACELP G.729 ITU-T G.729帧长度为10ms,包含两个5ms的子帧。短期分析和合成的基础是10阶线性预测滤波器。因为是10ms的短帧,所以LSP(线谱对)是通过4阶移动平均(MA)预测来量化的。线性预测剩余的量化使用了高效的两级向量量化程序——共轭结构(CS,conjugate structure)。对于LTP分析中的滞后使用了开环检索,用于为每个子帧的闭环检索提供候选。 在ABS-MSE过程中,将找出LTP的滞后和最佳代数代码本,自适应(LTP)增益和固定的代数)激励一起被向量量化为7个比特。音调增益为1左右,但是固定代码本增益则有很大的变化范围。为了应付这样大的范围,有一个固定系数的4阶MA增益预测器,通过参考以前的固定代码本激励向量序列来预测固定代码本增益(如图6-29所示)。 图6-29 1TU-T G.729 CS-ACELP 8kbit/s语音解码器基本概念 解码器中包含了一个后置滤波器(post filter),它由三个滤波器组成:一个长期后置滤波器,一个短期后置滤波器和一个倾斜补偿后置滤波器。 六、ITU-T G.723.1 为了以低比特率为PSTN(公共交换电话网)的视频会议应用提供一种有效的语音编码机制,因而使用了一种28.8或33.4 kbit/s V.34语音频带调制解调器,ITU-T为此还任命了一个语音编码专家组来选择最佳方案。经过一段短期而艰难的竞争,在两个候选方案中得了一个折衷方案。 G.723.1的诞生,一部分建议由Audiocodes和DSP Group提出,另一部分由Sherbrook大学和法国电信提出。这也解释了这个标准中出现两种改进代

文档评论(0)

kabudou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档