实时语音信号处理系统设计实例本章重点介绍基于tms320c671l.doc

实时语音信号处理系统设计实例本章重点介绍基于tms320c671l.doc

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实时语音信号处理系统设计实例本章重点介绍基于tms320c671l

实时语音信号处理系统设计实例 本章重点介绍基于TMS320C671l DSP的实时语音信号处理系统功能及其设计实现。首先介绍实时语音信号处理系统的设计,主要包括TMS320C6711 DSP和AD535 Codec介绍及其在系统设计中的应用。接着介绍DSP/B1OS I/O设备驱动及驱动程序编写。第4节介绍基于软什中断和PIP实现的实时语音处理系统实现。最后是基于任务和SIO实现的实时语音处理系统实现。 1? 语音信号处理概述 语音信号处理包括语音编码、语音识别、语音合成、回声消除(AEC)、语音激活检测(VAD)、语音增益自动控制(AGC)等。 1.1? 语音编码 ???? 1.语音编码器的功能 语音编码器的主要功能就是把用户语音的PCM(脉冲编码调制)样值编码成少量的比特(帧)。这种方法使得语音在链路产生误码、网络抖动和突发传输时具有健壮性(Robus-tness)。在接收端,语音帧先被译码为PCM语音样值,然后再转换成语音波形。 2.语音编码器的分类 语音编码器分为三种类型:(a)波形编码器;(b)声码器;(c)混合编码器。波形编码器会尽可能构出包括背景噪音在内的模拟波形。由于波形编码器作用于所有输入信号,因此会产生高质量的样值。然而,波形编码器工作在高比特率。例如:ITU-G.71l规范(PCM)用的比特率为64Kb/s。声码器(Vocoder)不会再生原始波形。这组编码器会提取一组参数,这组参数被送到接收端,用来导出语音产生模型,所以声码器又称为参数编码器。线性预测编码(LPC)用来获取一时变数字滤波器的参数。这个滤波器用来模拟说话人的声道输出。图6-1是合成分析操作,图6-2是低比特率编码器的MOS得分——比特率关系曲线(WEST96)。 在VoIP(Voice overIP)中常用的语音编码器是混合编码器,它融入了波形编码器和声码器的长处,它的另一个特点是它工作在非常低的比特率(4~6kb/s)。混合编码器采用合成分析(AbS)。 为了说明问题,考虑人的声道产生的一个语音模式:当人说话产生语音信号时就会发出浊音(如音素pa、da等)和清音(如音素sh、th)。激励信号就是由输入的语音信号导出的,其方法是使合成语音与输入语音的差别非常小。LPC的用法、激励的产生以及对合成分析(AbS)系统的误差检查均如图6-1所示。长话质量编码器在比特率高于8Kb/s时容易实现,如图6-2所示。长话质量的语音平均意见得分(MOS)必须在获许分以上。传统的PCM语音在比特率小于32 kb/s,语音质量会严重恶化,在这里就不讨论PCN了。混合编码和声码器在比特率相当低的MOS上的得分是可接受的。在现阶段,大多数基于VolP的编码器的工作范围在5.2~8kb/s。研究表明,标准的编码器在比特率为4 kb/s时能提供可接受的MOS得分,一些分0系统在4.8 kb/s的MOS上的得分为3.8。 ? 矢量量化和码激励线性预测一种较好的方法就是用预测存储的最优参数(码元矢量)的码本对输入语音信号的表示矢量进行编码,这种技术称为矢量量化(VQ,vectorquantization)。将VQ和AbS技术结合在一起会进一步提高编码性能。AbS VQ是技术构成CELP的基础。VQ和lAbS VQ的主要区别在于进行矢量量化码簿有哪些信誉好的足球投注网站时采用的量化失真测量定义的不同[WONG96]。 3.线性预测合成分析编码器 最常用的比特率在4.8kb/s~16 kb/s之间的语音编码器是基于模型编码器的,这些编码器都是线性预测合成分析(LPAS)方法。为了随着时间的变化模拟语音信号,线性预测语音产生模型必须用适当的信号来激励。每隔一段固定时间(如每隔20ms),语音模型参数和激励参数都必须做一次估计和更新,并用来控制语音模型。下面将介绍两种LPAS编码器:前向自适应LPAS编码器和后向自适应LPAS编码器。前向自适应LPAS编码器:8kb/s G.729编码器和6.3kb/s与5.3kb/s G.723.1编码器。在前向自适应的AbS编码器中,预测滤波器的系数和增益是实时传送的。为了提供长话质量的语音性能,这两种编码器都依赖于信源模型。激励信号(以语音基调周期的信息形式表示)也要传送。这种编码器所提供的模型对语音信号来说是比较好的,但对于一些噪音或者乐器来说并不合适。因此,在背景噪音和音乐环境下,LPAS编码器的质量比7.726和7.727的编码器的质量要差一些。 G.723.1 ITU-T G.723.1编码器在6.4kb/s提供长话质量语音。同时G.723.1还包括一个工作在5.3kb/s的低质量语音编码器。G.723.1是为低比特率可视电话而设计的。在这种适应中,由于视频编码时延通常人于语音编码时延,因此对时延的要求不是很严格。G.723.1编码器的帧长为30m

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档