- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用平均幅度差函数法进行基音周期估计.
Speech Pitch Period Estimation Based on AMDF
Abstract:Pitch period is a key parameter in speech compression , synthesis and recognition. The well-known AMDF is often used to determine this parameter.But it is easy to make the estimated pitch doubled. According to the conventional speech- generating mode AMDF, the paper refers to a new speech pitch determination algor-
ithm which bases on AMDF. The new method can resolve both the error by searching the first trough and the reduplication by searching the minimal trough. It can win more accurate results by forecasting the range of the rough value, making and linear- transformation.The algorithm not only simplifies the pitch detection ,but also efficie- ntly decreases the estimation errors and improves the precision of estimated values.
Key words:average magnitude difference function(AMDF);pitch period estimation
1 引言
基音是指发浊音时声带振动起的周期性, 而基音周期是指声带振动频率的倒数。基音周期检测是语音信号处理中的重要工作之一。然而基音周期的精确检测实际上是比较困难的。这是因为声门激励信号并不是一个完全的周期序列, 在语音开头和结尾部分不具有声带振动那样的周期性, 清音和有些浊音的过渡帧很难判断有没有周期性; 同时语音的共振峰会严重影响激励信号的谐波结构, 因为语音信号本身是有音调变化的; 另外人的基音周期变化范围比较大, 从50Hz到500Hz。
(a) 简化的语音生成数学模型
与自相关法相比,AMDF方法具有运算量小、精度高等优点,在军用语音编码中得到广泛应用。但是在AMDF方法中,经常发生基音估计结果为实际基音周期的2 倍,这不仅与语音信号波形复杂有关,还与短时AMDF函数的特性有关. 短时AMDF 函数随着滞后时间的增加,峰值幅度逐渐下降,这使得谷值点检测以及谷值点的清晰度检查比较困难,针对该问题,相关文献提出了不少改进方法。本文提出了一种改进的AMDF方法,它通过简单的预设谷值范围、线性变换等步骤实现了较精确的基音检测。
2 传统的AMDF函数与加权AMDF函数比较
传统的平均幅度差函数(Average Magnitude Difference Function ,AMDF) 是Ross 等人于1974 年提出的 ,其定义为:
(1)其中s(n) 为离散化的语音采样序列,当采用短时处理技术加方窗时 ,式(1) 变为:
(2)
从式(2) 可以看出计算 的差值项是不同的,,随着k的增加,求和的差值项数将逐渐减少,结果导致 峰值幅度随着滞后时间k 的增加而逐渐下降,为了有效地改正这一缺点提出了加权的平均幅度差函数(W-AMDF):
(3)
(b) 时域波形和及对应的传统AMDF
(c) 时域波形和及对应的加权AMDF
3 实验设计
1)首先对装载后的原始语音信号进行分帧,在参数选择上使得帧长等于帧移,而且帧长控制在比较小的范围内。编写一个判断每帧语音信号短时能量的函数,统计分帧后的语音信号每帧的平均能量,由于静音帧和清音帧的能量较浊音帧的能量小,那么可以根据实验结果选择合适的平均能量阈值,当某帧的能量小于该阈值时可以认为这帧不含有基音周期信息,把该帧的帧号记录在一个数组中。
(d)原始语音信号与去清音和静音后信号的比较
2)对每帧信号经过短时能量判断后,根据数组记录的帧号对对应帧的内容作置零处理,然后把非零内容的帧组成一个新的语音,这时候可以认为新的语音信号中含有丰
您可能关注的文档
- 局域网p2p资源共享软件的设计与实现..doc
- 矩形盾构法隧道施工技术探索(李刚)..doc
- 举例论述中国短命建筑的成因及其环境负荷..doc
- 矩阵论应用线性定常系统的自由运动稳定性的判据..doc
- 聚丙烯催化剂技术的开发现状及发展趋势..doc
- 聚合氯化铝的特性及其在水处理造纸中的应用..doc
- 聚合氯化铝改性硅藻土处理氨氮污水.doc
- 聚焦世界必威体育精装版棒线材生产工艺20110114..doc
- 居民消费储蓄和投资对经济增长影响的研究..doc
- 聚纤纺一种全新的纺纱方式..doc
- 2026年电子科技大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
- 2026年北京理工大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
- 2026年哈尔滨工业大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
- 2026年贵州大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
- 2026年东北财经大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
- 2026年福州大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
- 2026年北京科技大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
- 2026年北京工商大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
- 2026年河北大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
- 2026年东北大学翻译硕士(MTI)考研招生人数、参考书、考研经验、真题回忆.pdf
最近下载
- 5.3细胞的呼吸原理和应用 课件(共48张PPT) 人教版高中生物必修一.pptx VIP
- 天津华电南港热电项目环境影响报告.pdf
- 24D303-4 消防水泵机械应急启泵控制.pdf VIP
- 广东省深圳市龙岗区2025年5月中考二模【化学物理真题及答案】.pdf VIP
- 《化学品危害及防护》课件.ppt VIP
- 2024年12月六级真题及解析(第二套).docx VIP
- 小学校园安全教育全.ppt
- 《中学教育知识与能力》考试题库大全(按章节)-中学生学习心理.docx
- 零星维修改造工程施工方案施工组织设计投标方案(技术标).doc
- 冠状动脉粥样硬化性心脏病猝死防治专家共识(2024)解读.pptx VIP
文档评论(0)