语音编码总结课案.docx

下载文档 降价啦

2
0
约4.61千字
约 16页
2017-05-28 发布于湖北
举报
版权申诉
保障服务

语音编码总结课案.docx

1、本文档共16页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

语音编码总结课案

语音编码总结一、历史与概念1、模拟的声音信号话音信号：（口语发声的）200Hz~3400Hz调幅广播信号：（无线广播）50Hz到7000Hz调频广播信号：（无线广播）20Hz到16000Hz激光唱机信号（CD）：10Hz~20000Hz2、话音编码技术的历史回顾话音编码研究的历史表明，这一领域的研究成果直接为通信产业发展提供了源动力。目前IP电话所用的编码的标准有G.723.1, G.728, G.729。具有低延迟、低码率、低复杂性、高音质的话音编码算法将是未来IP电话网络的奠基石。 3、若干概念术语（1）数字信号：标称的不连续信号。它可以用离散的步差从一个状态转变到另一个状态。（2）采样：按周期T对模拟信号进行测量，称为采样。采样频率Fs=1/T.在满足奈奎斯特定理时，从采样值可准确的恢复原信号。（3）量化用数字信号表示话音的过程称为量化。（4）非均匀量化非均匀量化可以兼顾动态范围和小信号的系统精度。Reeves提出概念。即对大信号取较大的量化步长。对小信号取较小的量化步长。二、矢量量化将k个样点构成的有序集（信源矢量集合）映射为M个恢复失量构成的有限集A（码书，码本）中的某个矢量Yi（码字，码元）的映射，称为矢量量化，它是对标量量化在K维空间的一个推广。标量量化?矢量量化?量化对象?单个采样点?K个采样点?集合划分?在一维幅度轴上划分有限个区间?1=[a0?a1)…?n=[an-1?an)在k维空间里，划分成有限个子空间S={Si|i=1,2,…M}?量化过程?在每个区间里，选一个代表值?fi??i??I=1,2,…n在每个子空间里，选一个代表矢量Yi={Yi1,Yi2,Yii}??Yi??{Si}??i=1,2,…M量化方法?对任一模拟信号，当其标称?值?属于区间?i时，就用数字信号fi代表值?对任一k维模拟信号的矢量。?当其标称值属于子区间Si时,就用代表矢量Yi去量化之。?码本设计的LBG方法（1）在矢量空间X中，进行最佳划分，即，把X划分成M个子空间Si i=,1.2….m 使平均失真最小。（2）对划分后的子空间Si求出其形心作为新的最佳代表矢量Yi，从而构成新的码本。将上述步骤反复迭代，最终求出最佳码本和量化器。（3）初始码本的选择：A、随机选取，迭代时间较长B、分裂法（4）LBG方法不是最优化方法，即迭代过程不能保证收敛到全局最小值。后来有人提出模拟退火法，将LBG方法收敛到局部最小值时，采用某种扰动将迭代过程继续进行下去。 2、空间分布对矢量量化的影响LBG算法把问题简化为：在矢量空间中，样点的分布是均匀的。但实际的应用场合往往不满足这个前提。因此应考虑空间分布，空间分布对量化值的选择有很重要的影响。对矢量的情况，影响依然存在。3、语音编码方案的三种类型语音编码的主要任务：对量化的话音信号施加某种数字变化，使其具有适于数字信道传输的形式，同时尽可能多信号所承载的信息。话音信号的剩余度主要表现在三个方面：（1）相邻样点存在较强的相关性（2）对浊音信号存在周期（准周期）性（3）信号短时平稳，时不变性此外，人类听觉对话音有选择效应，即当一个强音与一个弱音同时存在时，人类听觉能够自动抑制弱音的效果，称为人耳的“掩蔽效应”。这些是话音压缩编码的出发点。3.1 波型编码：对话音信号的每一个样点进行量化、编码和传输。因此，波型编码是没有延迟的话音编码方案。3.1.1 差值脉码调制（DPCM和△-调制）一位的DPCM系统成为△-调制或增量调制DM。流程图如下：这里，^表示对应的量化值，上标 ~ 表示对应的预测值，用 ei 表示差值di的量化误差。收端恢复的量化信号只与差值信号的量化误差有关，而与预测器性质无关。（1）当信号变化快时，恢复波形跟不上信号的变化，称为”斜率过载“（2）对于零信号，DM方法交替输出一串0和1，这种随机交变电平成为“颗粒噪声”。解决办法是在量化器引入自适应阶矩调整机制（ADM）。如果自适应调整依据输入信号，称为前向自适应。如果自适应调整依据是量化器输，称为后向自适应。前向自适应将导致延迟的产生，后向自适应有可能不稳定。 3.1.2 连续可变斜率增量调制（CVSD）其原理可用下图说明：当反馈回路中，出现连续四个“1”或连续四个“0”时，表明系统出现斜率过载的情况，此时或门输出一个高电平，驱动触发器改变量化的阶矩的大小，以便适应输入信号的变化。3.1.3 自适应差值脉码调制（ADPCM）PCM:非均匀量化。D:调制。差值调制。CVSD：自适应概念将脉码调制、差值调制和自适应技术三者结合起来。使编码算法不仅适用于幅值起伏较大的话音信号，而且能很好的适合于平稳信号（如话带数据）。3.1.4信息压缩的基本思路1、信息与消息（1）消息是由符号、数字、文字或语言组成的序列。（2）信息是消息中