dsp 语音变速.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
dsp 语音变速

第四章 语音变速 在外语多媒体教学中,要求对语速进行快慢控制,以适应不同程度学生的需 求。但在改变语速的同时,要求保持原说话者的语调不变。本文就这方面的课题 进行了探讨与研究,并进行了一定的实践。 最简单的变速方法。考虑到在语音信号中,浊音具有准周期性而清音没有这 一特性。清音段对语音变速影响不大,可以忽略。如果将语音信号浊音段中的基 音周期找出来并适当地复制某些周期,就可以达到降低语速的效果,而适当地把 某些基音周期去掉就可以加快语速。图4-1 (a )所示是日本Hitachi 公司在1996 年做出来的一个语音变速系统。其原理如图4-1 (b )(c )所示就是将原始语音的 若干基音周期进行复制和剪切。在经过这样的处理后并没有改变声波的基频,因 此在改变了语速的同时,语音的音调基本保持不变。但是这种方法不具备任意调 整声音速度的能力。 (a ) (b ) (c ) 图4-1 日本Hitachi 公司语音变速系统及算法 58 第四章 语音变速 在近几年的语音分析/合成系统中,TD-PSOLA (时域基音同步叠加)算法已 经得到了广泛的应用。该算法实现简单,具有较强的时长调整能力,但是由于它 只是在时域内进行修正,必然会带来合成语音频域上的不连续,导致一定程度的 回声效应。 本文考虑到在实际的系统中语音的压缩存储和语音变速往往是同时需求的, 特提出一种基于 LPC 低比特率语音编码算法的语音变速算法,该算法能够任意 调整语音速率。 4.1 清音帧的语音变速 我们变速算法抛弃了以前传统的基音复制的思想。主要思想是将基音周期的 复制转化为帧长的伸缩。令原始帧长为N ,伸缩率为α,则调整后的帧长为N 。 α LPC 编码算法的清音帧的激励信号是随机噪声。因此将清音帧的帧长进行调 整不会影响清音帧的谱的结构。则清音帧只需要将随机噪声序列的长度改变为 N 即可。 α 4.2 浊音帧的语音变速 LPC 编码算法的清音帧的激励信号是冲击,因此不能将帧长加大,将一帧内 的语音序列增长。这样会改变语音的谱的结构。同3.6.2 这里仍然以正弦函数举 例。由浊音帧的合成过程,式(3.70 )~ (3.79 )可以看出改进的LPC 算法的重 要思想就是在帧间进行基因周期和幅度的插值。将这一思想拓展出去可以得到将 帧长增大后,仍然利用这种插值的思想可以得到谱包络基本上不发生变化的变速 后的语音信号。根据相邻两帧清浊音的信息,我们同样分四种情况讨论第l 帧语 音变速的合成 $ (1) 上一帧的和本帧语音都是清音,这时有s (n) 0 低速率语音编码算法研究及其实时实现 59 (2 ) 上一帧为浊音而本帧是清音,这时有 $   s (n) u (n)M cos lω n φ 0 n N (4.1) −1 −1 =+ ≤  −1 α u(n) 的取值范围于清音合成时相同,φ 是相位信息,具体计算在下面给出。

文档评论(0)

牛X文档 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档