第三部分语音编码技术祥解.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样-时间离散化 抽样-时间离散化 抽样-时间离散化 PCM的原理框图、采样值的量化和编码 优点:适应能力强,重建语音质量好 3.混合编码 它将波形编码与声源编码结合起来。 混合编码的数字信号中既包含若干语音特征参量, 又包括部分波形编码信息。因此,它具有声源编码的低比特率和波形编码再生语音质量高的双重优点。 在接收端的语音合成器中,由接收到的声源预测参数确定数字滤波器的参数,接收到的低频语音信号经过适当组合和平滑处理后作为激励信号输入到数字滤波器中恢复语音。 各种编码技术的数字信号速率和语音质量 语音编码技术 波形编码+参数编码 介于波形编码和参数编码的一种编码。 即在参数编码的基础上引入了波形编码的一些特征。 可在4----16kbit/s范围内达到良好的语音质量 混合编码基本原理: 语音编码技术 语音编码技术 3.2 语音编码器评价 帧大小: 帧的大小表示语音流量的时间长度,也称为帧时延。帧是语音信号的分立部件,且每帧是根据语音样点更新的。本章所介绍的编解码器都是一次处理一帧。每帧信息放在各语音分组中,并传送给接收端。 处理时延: 它表示在编解码器中对一帧语音做编码算法处理时所需的时间。它通常简单的计入帧时延。处理时延也称为算法时延。 前视时延: 编码器为了对当前帧的编码提供帮助而检查下一帧的一定长度,此长度就称为前视时延。前视的想法是为了利用相邻语音帧之间的密切相关性。 帧长度: 这个值表示经编码处理后的字节数(不包括帧头)。 语音编码技术 语音编码器评价(续) 语音比特率: 当编解码器的输入是标准脉冲编码调制的语音码流(比特率为64 kbit/s)时,编解码器的输出速率。 DSP MIPS: 此值是指支持特定编码器的DSP处理器的最低速度。 RAM需求: 它描述了支持特定的编码过程所需要RAM的大小。 编码工作所需时间:是指编码器的缓存及处理时间, 称为单向系统时延。其值=帧大小+ 处理时延+ 前视时延。显然,解码时延也非常重要。实际上,解码时延大约是编码时延的一半。 语音编码技术 3.3 G729语音编码器工作原理 语音编码技术 VOIP 处理流程介绍: 1、预处理:语音通过高通滤波后除去低频分量和直流分量,再经过8KHz波形采样,得到了16bit的编码速率为64kbit/s的PCM语音原始信号; 2、通过预处理的得到的原始语音信号一部分送到LP分析处理,将每10ms为一帧的信号进行LP分析,计算LP滤波器的系数,再吧LP系数转换成容易插值运算的线谱对(LSP),然后用ABS合成法有哪些信誉好的足球投注网站激励信号。 语音编码技术 处理流程介绍(续): 3、该激励信号通过LPC系数构造的合成滤波器后生成重构的语音信号。 4、将预处理的语音信号和第3步生成的重构的语音信号,进行相减,所得到的残差信号送入知觉加权滤波器处理,(残差信号以极小为原则),根据人耳听觉感受调整语音频谱,最的目的是把调整后的参数反馈给控制回路和确定激励信号及增益大小。 IP语音网络通信 * 语音编码技术 第三章 语音编码技术 重点:对语音编码的作用和工作原 理的具体了解 难点:对G.729,G.723编码器的了 解和应用 思考题: 1、简述语音编码的种类和特点 2、简述G729编码的工作原理 语音编码技术 3.1 语音压缩编码的目的和作用 语音信号的压缩编码是研究如何降低语音信号编码速率的问题 编码、传输、存储和译码是语音数字传输和数字存储的必要过程。 随着语音通信技术的发展,压缩语音信号的传输带宽,降低信道的传输速率,一直是人们追求的目标。语音编码在实现这一目标的过程中担当重要的角色。 语音编码就是使表达语音信号的比特数目最小。 语音编码技术 用比特/秒(b/s或bps)来度量,用I表示, I=R ? fs ,R代表每个语音采样值编码所需的比特数;fs是采样频率。 当fs=8kHz,每个采样值用8比特位来编码,则编码速率为64kb/s。 编码速率计算方法 常用语音编码总汇 ①PCM编码(原始数字音频信号流) 语音编码技术 类型:Audio 制定者:ITU-T 所需频宽:1411.2 Kbps 特性:音源信息完整,但冗余度过大 优点:音源信息保存完整,音质好 缺点:信息量大,体积大,冗余度过大 应用领域:素材保存及音乐欣赏 版税方式:Free ②WMA(Windows Media Audio) 类型:Audio 制定者:微软公司 所需频宽:320~112kbps(

文档评论(0)

四娘 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档