- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2014届本科毕业论文(设计)
题 目: ※※※※※※※※※※※※※※※
系 别: 信息工程学院
班 级: 20级计算机科学与技术(嵌入式技术方向)
学 号: 2060861???
姓 名: ※※※
指导教师: ※※※ 职 称 ※※※
起讫日期: 201年10月16日-201年5月31日
噪声环境下语音特征参数鲁棒性的研究
张三丰
三明学院 信息工程学院 20级计算机科学与技术(嵌入式技术方向)
摘要:实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究Mel倒谱参数、Mel差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。
关键词:语音识别;鲁棒性;Mel倒谱参数;Mel差分倒谱;倒谱系数零均值化
目 录
1
1.1 语音识别简介 1
1.1.1什么是语音识别 1
1.1.2 语音识别的应用及分类 1
1.2 国内外语音识别技术的发展历史及现状 1
1.3 语音识别面临的问题 2
1.4 本课题研究背景及内容 2
第二章 语音识别基础理论 3
2.1 语音信号产生的机理 3
2.2 语音信号的预处理 4
2.2.1 预滤波、采样、A/D转换 4
2.2.2 预加重 4
2.2.3 分帧加窗 5
2.3 端点检测 5
2.3.1 短时能量 6
2.3.2 短时平均过零率 7
第三章 常用的语音识别模型 8
第四章 噪声下语音特征参数的提取识别 9
第五章 结论 10
参考文献 11
附件 语音“0”的各状态频谱图 13
第一章 绪论
语言,是人类进行行为沟通和思想交流最重要的工具[1],也是人类最重要的信息载体。随着信息科技的快速发展,计算机的越来越便携化和应用的复杂化,在越来越多的领域有了让计算机听懂人言的要求,这样,就引出了语音处理技术这门交叉学科。语音识别技术,是语音处理技术中的一个重要组成。
1.1 语音识别简介
1.1.1什么是语音识别
所谓的语音识别是指利用计算机自动识别语音的技术,有狭义和广义之分。狭义的语音识别特指利用计算机识别出语音信号所表达的内容,其目的是要准确地理解语音所蕴含的含义,例如将语音转换成其所对应的文字。而广义的语音识别则泛指利用语音信号识别出其中所包含的“任何感兴趣”的内容的一种技术,例如利用语音信号中所包含的特定人的信息进行说话人身份辨认的说话人识别技术[2]。
1.1.2 语音识别的应用及分类
语音识别的应用范围十分广泛,遍及各行各业。如智能家居、语音拨号、信息通讯、自动应答系统、工业控制、机器人、交通导航等等。语音识别是一门新兴的交叉性学科,它广泛涉及声学、语音学、语言学、数字信号处理、通信学、网络技术、电子技术、计算机科学、模式识别和人工智能等众多学科。如前所述,语音识别系统有广义和狭义之分,这里所讨论的语音识别分类特针对狭义的语音识别而言[]。
[4, 5-8]可知“从不同角度,语音识别系统可以分为以下几类:按词汇量大小,可分为小词汇量、中等词汇量、大词汇量及无限词汇量语音识别系统;按对说话人的依赖程度可以分为特定人和非特定人语音识别系统;按对说话人说话方式的要求,可以分为孤立词语音识别系统、连接词语音识别系统及连续语音识别系统;按识别的目的来分,可以分为说话人语音识别系统和语音内容理解的语音识别系统。
1.2 国内外语音识别技术的发展历史及现状
语音识别的历史可以追溯到20世纪50年代。1952年ATT Bell实验室的确K.H.Davis等人利用带通滤波器进行语音频谱的分析和匹配,并成功用于对10个英文数字的识别,识别率达到98%。1960年P.Denes等研制成功第一个计算机语音识别系统,同年G.Fant提出了语音产生的声源——滤波器模型,对语音识别工作起到了巨大的推动作用。
20世纪80年代语音识别研究进一步走向深入,其研究重点是连接词语音识别,用于连接词识别的分层构筑技术(level building)得到发展。另一个重要的发展是语音识别算法从模板匹配技术发展到基于统计模型的技术。期间,美国CMU大学的J. K. Baker等人将隐马尔可
文档评论(0)