网站大量收购闲置独家精品文档,联系QQ:2885784924

语音信号基音周期检测的软件设计毕业论文.doc

语音信号基音周期检测的软件设计毕业论文.doc

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号基音周期检测的软件 目 录 I Abstract II 第1章 引言 1 1.1 课题研究目的及意义 1 1.2 基音周期检测的国内外研究现状 1 1.3 课题所作主要工作 5 1.4 各章节内容安排 5 第2章 总体方案设计 6 2.1 语音信号基音周期检测软件设计的思路 6 2.2 语音信号基音周期检测软件设计的功能分析 6 2.3 软件设计的组成 6 2.3.1 可视化界面 6 2.3.2 基因周期检测算法 7 2.4 本章小结 7 第3章 算法实现 8 3.1 常用算法介绍 8 3.1.1平均幅度差函数法 8 3.1.2 倒谱法 9 3.2 自相关算法原理 10 3.3 自相关算法流程 11 3.4 自相关算法数据分析 12 3.4.1 清/浊音判断分析 12 3.4.2 基音检测数据分析 12 3.4.3 自相关函数的抗噪性分析 14 3.5 自相关算法的实现及结果分析 14 3.6 算法的改进及存在问题 17 3.7 本章小结 18 第4章 系统软件设计 20 4.1 软件的介绍 20 4.2 软件总体设计思路 20 4.3 主程序流程设计 21 4.4 子程序设计 21 4.5 可视化界面设计 25 4.5.1 MFC界面介绍及使用说明 25 4.5.2 可视化界面组成部分及各部分功能分析 25 4.5.3 可视化界面的软件实现 25 4.6 软件调试 27 4.7 本章小结 28 结束语 31 参考文献 32 致谢 34 附录 35 第1章 引 言 语音不仅是人类最自然的信息载体,是人与人之间进行信息交流最直接、最方便和最有效的工具,而且也是人与机器之间进行通信的重要工具[1]。语音是语言的声学表达形式,在高度发达的信息时代,用数字化的方式进行语音传送、识别、合成、增强等,也是整个数字化通信网络中最重要、最基本的组成部分之一。 言语工程学所要解决的是用什么样的代码去处理言语的可变量和不变量[2]。目前的发展趋势显示 ,未来计算机将能实现人机自然对话,具有一个和谐的人机交互环境。这意味着数字语音处理技术的普及与飞跃,语音将成为未来人机交互的主要方式。 数字语音处理已经在众多领域得到了广泛的应用其中包括语音压缩、语音合成、语音识别、说话人识别以及语音增强等。这些方面的研究成果已经深入到通信、办公自动化、远距离控制、邮件分检、声控电话拨号、计算机语音应答,以及机器人听觉和口语系统等实际应用系统中而且越来越受到人们的重视语音信号最基本的研究方向就是语音信号的基。基音周期作为语音信号的一个重要参数,反映了语音激励源的重要特征。它的检测和估计是语音信号处理中的一项重要技术,与许多语音信号处理技术相关。 基音周期估计常称为基音检测,它的目标是找出和声带振动频率完全一致的基音周期变化轨迹曲线,或者是尽量吻合的轨迹曲线。语音信号的基因周期问题的实质上也就是准周期的周期估计问题。基音周期提取的精确性和效率直接影响到合成语音能否真实快速地再现原始语音信号基因周期检测应用在语音信号的各个领域中,如语音分析与合成、有调语音的辨意、低速率语音压缩编码、说话人识别等,它的准确性对起着非常关键的作用 1.2 基音周期检测的国内外研究现状 语音信号处理的研究工作最早可以追溯到19世纪70年代,而在20世纪得到了长足的发展,到了20世纪90年代,IBM、Apple、ATT、NTT等著名公司为语音识别的实用化开发投以巨资,致使语音信号处理技术的应用掀起了热潮[3]。近半个世纪以来,语音技术一直是许多学者研究的重点。尤其是八十年代后,在短短不到二十年的时间中, 语音技术研究在各个方面均取得了重大突破。在语音识别方面,隐马尔柯夫技术被成功地用于描述随机语音信号,并由此形成了以倒谱为技术引擎的统计语音识别主流算法。在此基础上,许多非特定人大词汇量连续语音识别系统在办公室环境下已接近实用化程度[4]。 汉语是一种单音节字组成词,然后在组成句子的语言结构系统里,汉语又是一种声调语言,声调在辨别语义中具有重要的作用,声调曲线分为弯头段、调型段和降尾段,其中只有调型段才有区别声调的作用声调的识别是以基音周期的估计为基础的。声调曲线就是基音周期的倒数基音频率的轨迹[5]。基音频率是语音信号最重要的参数之一 ,它的高低取决于声带的尺寸和特性,也决定于它所受的张力男性说话的基音频率分布在60~200Hz范围内,女性说话者和小孩的基音频率值在 200~450Hz范围内。 基音的提取是语音处理中的重要任务基音检测是语音处理中的一个非常重要的问题,但由于影响基音检测的因素众多,使得基音周期的准确估计非常困难。如短时平均幅度差函数法、倒谱法、小波变换法等几种经典的基音检测方法,都存在各自的优点及不足,应在预处理、后处理、语音信号的产生模型、语音信号的个性

文档评论(0)

你好世界 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档