语音编码总结讲述.docx

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音编码总结讲述

语音编码总结一、历史与概念1、模拟的声音信号话音信号:(口语发声的)200Hz~3400Hz调幅广播信号:(无线广播)50Hz到7000Hz调频广播信号:(无线广播)20Hz到16000Hz激光唱机信号(CD):10Hz~20000Hz2、话音编码技术的历史回顾话音编码研究的历史表明,这一领域的研究成果直接为通信产业发展提供了源动力。目前IP电话所用的编码的标准有G.723.1, G.728, G.729。具有低延迟、低码率、低复杂性、高音质的话音编码算法将是未来IP电话网络的奠基石。 3、若干概念术语(1)数字信号:标称的不连续信号。它可以用离散的步差从一个状态转变到另一个状态。(2)采样:按周期T对模拟信号进行测量,称为采样。采样频率Fs=1/T.在满足奈奎斯特定理时,从采样值可准确的恢复原信号。(3)量化用数字信号表示话音的过程称为量化。(4)非均匀量化非均匀量化可以兼顾动态范围和小信号的系统精度。Reeves提出概念。即对大信号取较大的量化步长。对小信号取较小的量化步长。二、矢量量化将k个样点构成的有序集(信源矢量集合)映射为M个恢复失量构成的有限集A(码书,码本)中的某个矢量Yi(码字,码元)的映射,称为矢量量化,它是对标量量化在K维空间的一个推广。标量量化?矢量量化?量化对象?单个采样点?K个采样点?集合划分?在一维幅度轴上划分有限个区间?1=[a0?a1)…?n=[an-1?an)在k维空间里,划分成有限个子空间S={Si|i=1,2,…M}?量化过程?在每个区间里,选一个代表值?fi??i??I=1,2,…n在每个子空间里,选一个代表矢量Yi={Yi1,Yi2,Yii}??Yi??{Si}??i=1,2,…M量化方法?对任一模拟信号,当其标称?值?属于区间?i时,就用数字信号fi代表值?对任一k维模拟信号的矢量。?当其标称值属于子区间Si时,就用代表矢量Yi去量化之。?码本设计的LBG方法(1)在矢量空间X中,进行最佳划分,即,把X划分成M个子空间Si i=,1.2….m 使平均失真最小。(2)对划分后的子空间Si求出其形心作为新的最佳代表矢量Yi,从而构成新的码本。将上述步骤反复迭代,最终求出最佳码本和量化器。(3)初始码本的选择:A、随机选取,迭代时间较长B、分裂法(4)LBG方法不是最优化方法,即迭代过程不能保证收敛到全局最小值。 后来有人提出模拟退火法,将LBG方法收敛到局部最小值时,采用某种扰动将迭代过程继续进行下去。 2、空间分布对矢量量化的影响LBG算法把问题简化为:在矢量空间中,样点的分布是均匀的。但实际的应用场合往往不满足这个前提。因此应考虑空间分布,空间分布对量化值的选择有很重要的影响。对矢量的情况,影响依然存在。3、语音编码方案的三种类型语音编码的主要任务:对量化的话音信号施加某种数字变化,使其具有适于数字信道传输的形式,同时尽可能多信号所承载的信息。话音信号的剩余度主要表现在三个方面:(1)相邻样点存在较强的相关性(2)对浊音信号存在周期(准周期)性(3) 信号短时平稳,时不变性 此外,人类听觉对话音有选择效应,即当一个强音与一个弱音同时存在时,人类听觉能够自动抑制弱音的效果,称为人耳的“掩蔽效应”。这些是话音压缩编码的出发点。3.1 波型编码:对话音信号的每一个样点进行量化、编码和传输。 因此,波型编码是没有延迟的话音编码方案。3.1.1 差值脉码调制(DPCM和△-调制) 一位的DPCM系统成为△-调制或增量调制DM。流程图如下: 这里,^表示对应的量化值,上标 ~ 表示对应的预测值,用 ei 表示差值di的量化误差。收端恢复的量化信号只与差值信号的量化误差有关,而与预测器性质无关。(1)当信号变化快时,恢复波形跟不上信号的变化,称为”斜率过载“(2)对于零信号,DM方法交替输出一串0和1,这种随机交变电平成为“颗粒噪声”。解决办法是在量化器引入自适应阶矩调整机制(ADM)。如果自适应调整依据输入信号,称为前向自适应。如果自适应调整依据是量化器输,称为后向自适应。前向自适应将导致延迟的产生,后向自适应有可能不稳定。 3.1.2 连续可变斜率增量调制(CVSD)其原理可用下图说明:当反馈回路中,出现连续四个“1”或连续四个“0”时,表明系统出现斜率过载的情况,此时或门输出一个高电平,驱动触发器改变量化的阶矩的大小,以便适应输入信号的变化。3.1.3 自适应差值脉码调制(ADPCM)PCM:非均匀量化。D:调制。差值调制。CVSD:自适应概念将脉码调制、差值调制和自适应技术三者结合起来。使编码算法不仅适用于幅值起伏较大的话音信号,而且能很好的适合于平稳信号(如话带数据)。3.1.4信息压缩的基本思路1、信息与消息(1)消息是由符号、数字、文字或语言组成的序列。(2)信息是消息中

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档