- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用平均幅度差函數法进行基音周期估计
Speech Pitch Period Estimation Based on AMDF
Abstract:Pitch period is a key parameter in speech compression , synthesis and recognition. The well-known AMDF is often used to determine this parameter.But it is easy to make the estimated pitch doubled. According to the conventional speech- generating mode AMDF, the paper refers to a new speech pitch determination algor-
ithm which bases on AMDF. The new method can resolve both the error by searching the first trough and the reduplication by searching the minimal trough. It can win more accurate results by forecasting the range of the rough value, making and linear- transformation.The algorithm not only simplifies the pitch detection ,but also efficie- ntly decreases the estimation errors and improves the precision of estimated values.
Key words:average magnitude difference function(AMDF);pitch period estimation
1 引言
基音是指发浊音时声带振动起的周期性, 而基音周期是指声带振动频率的倒数。基音周期检测是语音信号处理中的重要工作之一。然而基音周期的精确检测实际上是比较困难的。这是因为声门激励信号并不是一个完全的周期序列, 在语音开头和结尾部分不具有声带振动那样的周期性, 清音和有些浊音的过渡帧很难判断有没有周期性; 同时语音的共振峰会严重影响激励信号的谐波结构, 因为语音信号本身是有音调变化的; 另外人的基音周期变化范围比较大, 从50Hz到500Hz。
(a) 简化的语音生成数学模型
与自相关法相比,AMDF方法具有运算量小、精度高等优点,在军用语音编码中得到广泛应用。但是在AMDF方法中,经常发生基音估计结果为实际基音周期的2 倍,这不仅与语音信号波形复杂有关,还与短时AMDF函数的特性有关. 短时AMDF 函数随着滞后时间的增加,峰值幅度逐渐下降,这使得谷值点检测以及谷值点的清晰度检查比较困难,针对该问题,相关文献提出了不少改进方法。本文提出了一种改进的AMDF方法,它通过简单的预设谷值范围、线性变换等步骤实现了较精确的基音检测。
2 传统的AMDF函数与加权AMDF函数比较
传统的平均幅度差函数(Average Magnitude Difference Function ,AMDF) 是Ross 等人于1974 年提出的 ,其定义为:
(1)其中s(n) 为离散化的语音采样序列,当采用短时处理技术加方窗时 ,式(1) 变为:
(2)
从式(2) 可以看出计算 的差值项是不同的,,随着k的增加,求和的差值项数将逐渐减少,结果导致 峰值幅度随着滞后时间k 的增加而逐渐下降,为了有效地改正这一缺点提出了加权的平均幅度差函数(W-AMDF):
(3)
(b) 时域波形和及对应的传统AMDF
(c) 时域波形和及对应的加权AMDF
3 实验设计
1)首先对装载后的原始语音信号进行分帧,在参数选择上使得帧长等于帧移,而且帧长控制在比较小的范围内。编写一个判断每帧语音信号短时能量的函数,统计分帧后的语音信号每帧的平均能量,由于静音帧和清音帧的能量较浊音帧的能量小,那么可以根据实验结果选择合适的平均能量阈值,当某帧的能量小于该阈值时可以认为这帧不含有基音周期信息,把该帧的帧号记录在一个数组中。
(d)原始语音信号与去清音和静音后信号的比较
2)对每帧信号经过短时能量判断后,根据数组记录的帧号对对应帧的内容作置零处理,然后把非零内容的帧组成一个新的语音,这时候可以认为新的
您可能关注的文档
- 初中美術教学论文.doc
- 24种致癌芳香胺以及苯胺的显色效果图及检出限.docx
- 20第二十章信息化施工技术.docx
- 251例独生子女病残儿鉴定结果分析.doc
- 23民主管理共创幸福生活(文).doc
- 25《我的老师》第二课时目标导学案.doc
- 23民主管理课时练习.doc
- 23信息价值的判断教案《上海科教》.doc
- 24问银河第二课时.doc
- 初中英語七年级上册知识点总结.doc
- 中国国家标准 GB/T 22517.2-2024体育场地使用要求及检验方法 第2部分:游泳场地.pdf
- GB/T 22517.2-2024体育场地使用要求及检验方法 第2部分:游泳场地.pdf
- 《GB/T 22517.2-2024体育场地使用要求及检验方法 第2部分:游泳场地》.pdf
- 苏教版(2017秋)科学三年级下册1.《种子发芽了》 教案(含课堂练习和反思).docx
- 2024-2025学年小学数学六年级上册冀教版(2024)教学设计合集.docx
- 地理商务星球版七年级上册4.5形成气候的主要因素 同步教案.docx
- 2024-2025学年中职中职专业课金融类73 财经商贸大类教学设计合集.docx
- 2024-2025学年初中地理七年级上册(2024)仁爱科普版(2024)教学设计合集.docx
- 2024-2025学年小学英语二年级上册外研版(一起)教学设计合集.docx
- 2024-2025学年高中数学选择性必修 第二册北师大版(2019)教学设计合集.docx
文档评论(0)