- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
南阳师范学院2012届毕业生
毕业论文(设计)
题 目: 语音识别技术及发展
完 成 人: 陈 哲
班 级: 软件工程20班
学 制: 2 年
专 业: 软件工程
指导教师: 赵艳丽
完成日期: 2012-04-14
目 录
摘要 (1)
1绪论 (1)
1.1本课题研究的背景与意义 (1)
1.2国内外研究概况 (3)
1.3目前仍存在的问题 (5)
1.3.1语音识别的方言和口音问题 (5
1.3.2信道问题 (5
1.3.3背景噪音问题 (5
1.3.4自然语音理解领域 (5
1.3.5语音合成 (5
2语音识别技术概述 (6)
2.1语音识别的类型 (6)
2.1.1以所要识别的单位来分 (6)
2.1.2以说话人来分 (6)
2.1.3以识别方法来分 (6)
2.2语音识别的原理 (7)
2.3语音识别的基本过程 (7)
3语音识别的基本方法 (8)
3.1基于语音学和声学的方法 (9)
3.2模版匹配的方法 (9)
3.2.1动态时间规整(DTW) (9)
3.2.2隐马尔可夫法(HMM) (9)
3.2.3矢量量化(VQ) (9)
3.3神经网络的方法 (10)
4语音识别系统的结构和所面临的问题 (10)
4.1语音识别系统的结构 (10)
4.1.1语音信号预处理与特征提取 (10)
4.1.2声学模型与模式匹配 (11)
4.1.3语音模型与语音处理 (12)
4.2语音识别所面临的问题 (12)
4.2.1算法模型方面 (12)
4.2.2自适应方面 (12)
4.2.3强健性方面 (13)
4.2.4多语言混合识别已经无限词汇识别方面 (13)
4.2.5多语种交流系统的应用 (13)
5语音识别的应用 (14)
5.1语音识别的应用简介 (14)
5.2语音识别在公安工作中的应用 (15)
5.2.1历史背景和现状 (15)
5.2.2在侦查工作中的应用 (15)
5.2.3在抓捕中的应用 (16)
5.2.4在取证中的应用 (16)
5.2.5在执行取保候审、监视居住等强制措施中的应用 (17)
6总结 (17)
参考文献 (18)
Abstract (18)
语音识别技术及发展
作 者:陈 哲
指导教师:赵艳丽
摘要:语音是人们相互之间交流最直接最有效的方式,作为一种人机界面,语音与键盘、鼠标输入相比是最自然的输入方式。语音识别技术从上世纪50年代开始到现在已经有了巨大进展,促使人们迫切把它推向实用领域,而不满足于只是理论研究。人们期望通过在移动通讯设备中引入语音识别系统使得语音识别技术真正从实验室走向日常生活。
关键词:语音识别;低代价;实时;端点检测;说话人自适应
1绪论
1.1本课题研究的背景与意义
随着现代科学的发展,人们在与机器的信息交流中,需要一种更加方便、自然的方式,而语言是人类最重要、最有效、最常用和最方便的通信形式。这就很容易让人想到能否用自然语言代替传统的人机交流方式(如键盘、鼠标等)。人机自然语音对话就意味着机器应具有听觉,能“听懂”人类的口头语言,这就是语音识别(Speech Recognition)的功能。语音识别是语音信号处理的重要研究方向之一,它是一门涉及面很广的交叉学科,与计算机、通信、语音语言学、数理统计、信号处理、神经生理学、神经心理学、模式识别、声学和人工智能等学科都有密切的联系。它还涉及到生理学、心理学以及人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解) [1]。
语音识别技术以语言为研究对象,涉及生理学、语言学、计算机及信号处理等多个领域,是语言信号处理的一个重要研究方向,在智能控制、多媒体、人机对话等方面有着极其广泛的应用前景。特别是在各种智能机器人领域,基于语音识别技术的导航控制为人机交流、合作提供了有效的途径,成为当前智能机器人的热点之一。
语音是语言信息的载体,语音识别的基本任务是将输入的语音转化为相应的语言代码。这样,不仅使存储或传输这样的语言代码时的数码率比起存储或传输原来有语音信号来大幅度降低,而且还在于它把一种连续的语音信号变成了一种有限符号,这样的符号容易被计
文档评论(0)