IP电话中语音编码的应用.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
IP电话中语音编码的应用

IP电话中语音编码的应用 2011级数计院6班罗嘉欣 IP电话是IP网上通过TCP/IP协议实现的一种电话应用,这种应用包括PC对PC连接、PC对电话连接、电话对电话的连接,其业务主要有Internet或Intranet上的语音业务、传真业务(实时和存储/转发)、web上实现的WR(交互式语音应答)业务等等,另外还包括E-mail、实时电话、实时传真等多种通信业务。由于IP电话的推动作用,电话网和数据网正逐步合为一体。这个统一将为我们提供更加强大,更为经济的通信手段。本文主要简述IP电话的语音技术,以及语音编码的关键技术的原理。 IP语音技术 IP语音技术(VoIP)是建立在IP技术上的分组化、数字化传输技术,其基本原理是:通过语音压缩算法对语音数据进行压缩编码处理,然后把这些语音数据按IP等相关协议进行打包,经过IP网络把数据包传输至l J接收地,经过解码解压处理后,恢复成原来的语音信号,从而达到由IP网络传送语音的目的。其模型的基本结构图如图1-1所示。经过IP电话系统的转换及压缩处理,每个普通电话传输速率约占用8~11 Kbit,/s带宽,因此在与普通电信网同样使用传输速率为64kbit/s的带宽时,IP电话数是原来的5~8倍。 语音编码器中采用的关键技术 一、线性预测编码 线性预测编码(LPC)技术是常见的一种语音分析技术,原理框图如下: 线性预测分析是LPC的关键。线性预测分析的基本原理是一个语音抽样可以用若干个语音抽样的线性组合来逼近。通过使有限时间内实际语音抽样和线性预测抽样之间的差值平方和最小,来唯一地确定一组预测参数,即线性组合中所用的加权系数。语音分析包括两类:一类是基音提取,提取的参数包括清音/浊音判决和基音周期;另一类是短时线性分析,提取的参数包括线性滤波器系数a:和增益G,将所提取的参数进行量化和编码就可以得到编码语音信号。图中的预加重模块的作用是增强语音频谱中的高频共振峰,使语音短时谱和线性预测分析中的余量频谱变得更为平坦,从而提高参数a,的估计精度。加窗模块的作用是实现逐帧分析时的平滑衔接。当短时线性预测采取自相关方法的时候,在截断时间片的边缘会产生较大的误差。为了减少误差,在分帧的同时加上有限窗口就可以平滑数据的过渡,在实际的应用中多采用汉明窗口。G.729采用10阶线性预测滤波器对输入语音信号进行短时相关分析,采用半个汉明窗口和四分之一的余弦函数对输入语音信号进行加窗处理。 二、合成分析法 如下图所示。合成分析方法将合成器引入编码器,使之与分析器相结合。先对输入信号进行“分析”,提取发声模型中的参数。然后选择激励信号去激励声道模型,产生“合成”声音。将此合成声音与原始语音相比较,根据一定的误差准则调整计算各个参数,使两者之间的误差达到最小。 三、感知加权滤波 通过最小化残差信号方差的判据确定的量化误差具有平坦的噪音频谱,但是实际上人的听觉系统对于不同频段噪声的感觉是不一样的。众所周知,如果有一个强信号存在,一个本来可以听到的话音可能被淹没为不可闻信号,这就是掩蔽效应。感知加权滤波器的作用就是对残差信号进行频谱掩蔽,也就是按照话音信号频谱的峰值来整形量化噪声,使得量化噪声的能量集中在原信号的高能区域。加入感知加权滤波器后,得到的量化噪声也许会增加,但是对于人的听觉系统来说,可感的噪声却降低了。 四、矢量量化 矢量量化不是对每个参数独立地进行量化,而是将所有的参数组合起来作为一个整体进行量化。矢量量化的工作原理是将待编码的输入数据序列分组,每一组(包含m个数据)被描述成有m个元素的矢量,让每一个矢量与一个预先训练好的码本(Codebook)中的矢量按照某种失真准则进行比较,找到一个最匹配的矢量,并用此矢量的序号对输入矢量进行编码;解码端具有和编码端完全相同的码本,这样就可以根据矢量的序号找到对应的矢量,恢复原来的参数。具体过程如下图所示。由于在信道中传输的是信号码本的序号而不是矢量,所以传输数据得到了很大的压缩。 矢量量化技术中有两个关键问题,一是如何建立码本结沟,使其忠实反映实际参数的组合情况;二是采用何种误差准则,一般多采用最小均方误差准则。码本结构一般通过码本训练过程来确定。G.729a采用的是一种算数码本结构,激励信号表示为有限个预定位置的单位增益脉冲。 五、码激励线性预测 码激励线性预测(CELP)技术是1985年由Manfred R.Schroeder和B.5.Atal在IEEEICASSP年会上提出来的。它以高质量的合成语音及很好的抗噪声性能,在4.8~16kbi灯S速率上得到了广泛的应用。后来经过研究又提出了多种改进方案,如短时延码激励线性预测编码LD-CELP,矢量和激励线性预测编码VSELP,以及共扼结构-算术码本激励线性预测(CS-ACELP)算法,它提供

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档