- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2014届本科毕业论文(设计)
题 目: ※※※※※※※※※※※※※※※
系 别: 信息工程学院
班 级: 2010级计算机科学与技术(嵌入式技术方向)
学 号: 201060861???
姓 名: ※※※
指导教师: ※※※ 职 称 ※※※
起讫日期: 2013年10月16日-2014年5月31日
噪声环境下语音特征参数鲁棒性的研究
张三丰
三明学院 信息工程学院 2010级计算机科学与技术(嵌入式技术方向)
摘要:实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究Mel倒谱参数、Mel差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。
关键词:语音识别;鲁棒性;Mel倒谱参数;Mel差分倒谱;倒谱系数零均值化
目 录
第一章 绪论 1
1.1 语音识别简介 1
1.1.1什么是语音识别 1
1.1.2 语音识别的应用及分类 1
1.2 国内外语音识别技术的发展历史及现状 1
1.3 语音识别面临的问题 2
1.4 本课题研究背景及内容 2
第二章 语音识别基础理论 3
2.1 语音信号产生的机理 3
2.2 语音信号的预处理 4
2.2.1 预滤波、采样、A/D转换 4
2.2.2 预加重 4
2.2.3 分帧加窗 5
2.3 端点检测 5
2.3.1 短时能量 6
2.3.2 短时平均过零率 7
第三章 常用的语音识别模型 8
第四章 噪声下语音特征参数的提取识别 9
第五章 结论 10
参考文献 11
附件 语音“0”的各状态频谱图 13
第一章 绪论
语言,是人类进行行为沟通和思想交流最重要的工具[1],也是人类最重要的信息载体。随着信息科技的快速发展,计算机的越来越便携化和应用的复杂化,在越来越多的领域有了让计算机听懂人言的要求,这样,就引出了语音处理技术这门交叉学科。语音识别技术,是语音处理技术中的一个重要组成。
1.1 语音识别简介
1.1.1什么是语音识别
所谓的语音识别是指利用计算机自动识别语音的技术,有狭义和广义之分。狭义的语音识别特指利用计算机识别出语音信号所表达的内容,其目的是要准确地理解语音所蕴含的含义,例如将语音转换成其所对应的文字。而广义的语音识别则泛指利用语音信号识别出其中所包含的“任何感兴趣”的内容的一种技术,例如利用语音信号中所包含的特定人的信息进行说话人身份辨认的说话人识别技术[2]。
1.1.2 语音识别的应用及分类
语音识别的应用范围十分广泛,遍及各行各业。如智能家居、语音拨号、信息通讯、自动应答系统、工业控制、机器人、交通导航等等。语音识别是一门新兴的交叉性学科,它广泛涉及声学、语音学、语言学、数字信号处理、通信学、网络技术、电子技术、计算机科学、模式识别和人工智能等众多学科。如前所述,语音识别系统有广义和狭义之分,这里所讨论的语音识别分类特针对狭义的语音识别而言[3]。
由文献[4, 5-8]可知“从不同角度,语音识别系统可以分为以下几类:按词汇量大小,可分为小词汇量、中等词汇量、大词汇量及无限词汇量语音识别系统;按对说话人的依赖程度可以分为特定人和非特定人语音识别系统;按对说话人说话方式的要求,可以分为孤立词语音识别系统、连接词语音识别系统及连续语音识别系统;按识别的目的来分,可以分为说话人语音识别系统和语音内容理解的语音识别系统”。
1.2 国内外语音识别技术的发展历史及现状
语音识别的历史可以追溯到20世纪50年代。1952年ATT Bell实验室的确K.H.Davis等人利用带通滤波器进行语音频谱的分析和匹配,并成功用于对10个英文数字的识别,识别率达到98%。1960年P.Denes等研制成功第一个计算机语音识别系统,同年G.Fant提出了语音产生的声源——滤波器模型,对语音识别工作起到了巨大的推动作用。
20世纪80年代语音识别研究进一步走向深入,其研究重点是连接词语音识别,用于连接词识别的分层构筑技术(level building)得到发展。另一个重要的发展是语音识别算法从模板匹配技术发展到基于统计模型的技术。期间,美国CMU大学
您可能关注的文档
- 低温等离子消毒机理及应用技术.doc
- 低碳经济 全球应对气候变化历史进程.doc
- 低碳经济与可持续发展 92分.docx
- 低碳经济90分.doc
- 低碳经济与可持续发展(讲义)_27614.doc
- 低碳经济与绿色物流.doc
- 低碳经济对中国经济的影响论文.doc
- 低碳经济循环经济与加快经济发展方式转变培训.doc
- 低碳经济是中国可持续发展的必由之路.doc
- 低碳经济考试题(含答案).doc
- 5.3.1函数的单调性(教学课件)--高中数学人教A版(2019)选择性必修第二册.pptx
- 部编版道德与法治2024三年级上册 《科技提升国力》PPT课件.pptx
- 2.7.2 抛物线的几何性质(教学课件)-高中数学人教B版(2019)选择性必修第一册.pptx
- 人教部编统编版小学六年级上册道德与法治9 知法守法 依法维权(第一课时)课件.pptx
- 三年级上册品德道德与法治《学习伴我成长》.pptx
- 部编版小学道德与法治六年级上册6 人大代表为人民 课件.pptx
- 部编版小学道德与法治六年级上册1感受生活中的法律第一课时课件.pptx
- 2.5.2圆与圆的位置关系(教学课件)-高中数学人教A版(2019)选择性必修第一册.pptx
- 2.5.1直线与圆的位置关系-(教学课件)--高中数学人教A版(2019)选择性必修第一册.pptx
- 14.1.1 同底数幂的乘法(教学课件)-初中数学人教版八年级上册.pptx
最近下载
- 刘珉《国际贸易实务》第2版 课件 全套课件.pptx
- 健康服务与管理人才职业岗位能力需求调查研究-来源:中国高等医学教育(第2020011期)-浙江大学 全国高等医学教育学会.pdf VIP
- 某某医院整体搬迁实施的方案.doc
- GB50327-2001住宅装饰装修工程施工规范.docx
- 第2章 飞行事故中人的因素《飞行中人的因素》.pptx VIP
- 小学五年级上册科学教学:《摆的快慢》说课.docx
- 统编版语文六年级上册-13 桥-教学课件(多篇).pptx VIP
- DELI 得力AA186W条码扫描器说明书.pdf
- 统编版语文六年级上册13《桥》(教学课件).pptx
- 办公软件EXCEL技巧培训课件.pptx
文档评论(0)