dsp语音信号处理论文.docVIP

下载本文档

2
0
约1.89万字
约 26页
2019-11-15 发布于上海
举报
版权申诉

dsp语音信号处理论文.doc

1、本文档共26页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

目录 TOC \o 1-2 \h \z \u 第一章绪论 1 1.1语音信号处理技术简介 1 1.2 语音识别系统 1 1.3 语音识别的关键技术 2 第二章 MATLAB的GUI设计原理 4 2.1 MATLAB的GUI设计概述 4 2.2 语音信号处理工具箱GUI设计步骤 5 第三章基于MATLAB的语音信号处理GUI设计 8 2.1 语音信号的短时分析 9 2.2 分析语音信号的短时谱特性 9 2.3 语音信号倒谱与复倒谱的分析 10 2.4 运用自相关方法估计语音信号的声道参数 11 2.5 基音周期检测 12 2.6 语音信号增强 14 2.7 语音信号端点检测 16 2.8 基于MATLAB的语音信号工具箱GUI设计 17 第四章总结与展望 18 附录 19 参考文献 25 第一章绪论 1.1语音信号处理技术简介语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科，是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。同时，语言也是人与机器之间进行通信的重要工具，它是一种理想的人机通信方式，因而可为计算机、自动化系统等建立良好的人机交互环境，进一步推动计算机和其他智能机器的应用，提高社会的信息化和自动化程度。语音信号处理是一门新兴的学科，同时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科，但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。 20世纪60年代中期形成的一系列数字信号处理的理论和算法，如数字滤波器、快速傅立叶变换（FFT）等是语音信号数字处理的理论和技术基础。随着信息科学技术的飞速发展，语音信号处理取得了重大的进展：进入70年代之后，提出了用于语音信号的信息压缩和特征提取的线性预测技术（LPC），并已成为语音信号处理最强有力的工具，广泛应用于语音信号的分析、合成及各个应用领域，以及用于输入语音与参考样本之间时间匹配的动态规划方法；80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化（VQ）应用于语音信号处理中；而用隐马尔可夫模型（HMM）描述语音信号过程的产生是80年代语音信号处理技术的重大发展，目前HMM已构成了现代语音识别研究的重要基石。近年来人工神经网络(ANN)的研究取得了迅速发展，语音信号处理的各项课题是促进其发展的重要动力之一，同时，它的许多成果也体现在有关语音信号处理的各项技术之中。语音信号处理技术的应用极其广泛，涉及工业、军事、交通、医学、民用等各个领域，其中最重要的包括语音编码、语音合成、语音识别以及语音增强等。 1.2 语音识别系统根据对说话人说话方式的要求，可分为孤立词语音识别系统，连接词语音识别系统和连续语音识别系统。 根据对说话人的依赖程度，可分为特定人语音识别系统和非特定人语音识别系统。根据词汇量大小，可分为小词汇量、中等词汇量、大词汇量及无限词汇量语音识别系统。孤立单词识别系统,孤立单词指单词之间有停顿，这可使识别问题大为简化。因为单词的端点检测（即检测单词的起点和终点）比较容易，而且单词之间协同发音影响可减至最低。此外，一般对孤立单词发音比较认真，由于单词之间必须有停顿，读起来就不能太流利。鉴于以上原因，孤立单词识别系统存在的问题最少，其许多技术可以用于单词挑选和连续语音识别系统。连续语音识别系统有两个重要问题是孤立单词识别系统所没有的：切分，即对单词之间边界位置的确定。因为语言中短语的数量太大，对整个短语进行识别显然是不可能的，必须把输入的语流切分为更小的组成部分。这就要求系统必须能够识别单词之间的边界。这一点比较困难，因为确定单词之间的边界位置没有现成的方法。发音变化，即关联语言的发音比孤立单词发音更随便，受协同发音的影响更为严重。解决上述问题通常采用扩展动态时间规整技术。语音理解一词出自美国远景研究计划局资助的一个庞大的连续语音识别研究项目，其目标称为语音理解系统。众所周知，只有人才能很好地识别语音，因为人对语音有广泛的知识，人对要说的话有预见性和感知分析能力，因此，指望机器对语言的识别能力超过人是不现实的，最好的办法是使机器也能“理解”语言，并且能象人一样运用这种理解力。由于在人工智能领域对知识的应用和知识的表示问题更加感性趣，这对语音识别来说无疑是有力地鼓舞。运用这种理解力可以指望系统：能排除噪声和嘈杂声（即含糊不清或无关的语言）；能理解上下文的