- 1、本文档共45页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号端点检测技术的研究毕业论文
目 录
摘要 I
Abstract II
第1章 绪论 1
1.1语音端点检测研究背景 1
1.2语音端点检测研究意义 2
1.3语音端点检测研究动态 4
1.4本文组织结构 5
第2章 语音信号处理基础 7
2.1 语音信号的数学模型 7
2.2语音端点检测预处理 8
2.2.1预滤波 8
2.2.2预加重 8
2.2.3分帧 8
2.2.4加窗 9
2.3语音信号的时域分析 10
2.3.1短时能量和短时幅度 10
2.3.2短时过零率 10
2.4语音信号的频域分析 11
2.4.1滤波器组法 11
2.4.2傅里叶变换法 11
2.5语音端点检测主要步骤 13
2.6影响语音端点检测的原因及噪声分类 13
2.6.1影响语音端点检测的原因 13
2.6.2噪声分类 14
2.7本章小结 16
第3章 语音端点检测的相关算法 17
3.1基于短时能量的端点检测 17
3.2基于时频方差和的检测方法 21
3.3基于多特征的端点检测方法 25
3.3.1基于短时过零率和短时能量的端点检测方法 25
3.3.2基于谱减法的端点检测方法 28
3.4 本章小结 32
第4章 基于距离熵的语音端点检测算法 33
4.1熵的基本介绍 33
4.2基于谱熵的端点检测方法 33
4.3基于距离熵的语音端点检测方法 34
4.3.1距离熵 34
4.3.2算法构架 36
4.4实验结果 39
4.5本章小结 42
结论 43
参考文献 44
致谢 48
附录1 开题报告
附录2 文献综述
附录3 中期报告
附录4 英文文献
附录5 英文翻译
第1章 绪论
1.1语音端点检测研究背景
语言是人类特有的功能,声音是人类常用的工具,通过声音传递信息是人类最重要、最有效、最准确、最方便的信息交换的方式。随着现代科学的蓬勃发展,人类社会越来越显示出信息社会的特点,犹如衣、食、住、行对于人类是必要的一样,通信和信息交换也成为了人类社会存在的必要条件,不但在人与人之间,而且在人与机器之间每时每刻都需要进行大量的信息交换,让计算机听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法,计算机越来越向便携化方向发展,计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚。在电子计算机和人工智能机器的广泛应用中,人们发现,人和机器之间最好的通讯方式是直接进行语言通讯,实现人机自由对话,赋予机器以听觉,辨别话音的内容或者辨别说话人的身份,使机器能够按照人的意志进行各种操作,把人类从繁重或危险的劳动中解脱出来。用现代手段研究语音处理技术,使人们能更加有效地产生。
语音技术的应用己经成为一个具有竞争性的高新技术产业,它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理,工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面[1]。语音处理内容涉及到计算机科学,模式识别,信号处理,生理学,语音学,心理学等学科,还涉及到信号和信息处理系统,通信和电子系统等具体应用领域,多媒体技术的发展,使语音技术逐渐在越来越多的场合中推广使用,语音信号处理技术发展迅速,其研究成果具有重要的学术及应用价值,涉及一系列前沿课题,语音信号处理与信息科学中最活跃的前沿科学密切联系,并且共同发展。例如,神经网络理论、模糊集理论、小波理论是当前热门的研究领域,这些领域的研究常常把语音处理任务作为一个应用实例,而语音处理研究者也从这些领域的研究进展中找到突破口,使语音处理技术研究取得进展。从技术角度讲,语音信号处理是信息高速公路、多媒体技术、办公自动化现代通信及智能系统等新兴领域应用的核心技术之一。
经过几十年的努力,语音信号处理在语音识别、语音增强、语音编码、说话人识别、说话人情感识别、语音合成等方面取得了巨大的进步,然而,一旦这些技术应用在实际环境中,由于环境噪声、信道、说话人自身因素等方面的影响, 性能急剧下降,因为在实际环境中没有完全纯净的语音信号,一般都会伴有噪声或其它干扰[2]。例如,办公室环境下,电脑风扇转动的声音,键盘敲打的声音等都是噪声,而语音信号处理系统的处理对象是有效语音信号,即排除了纯噪声段的语音信号段,语音端点检测的任务就是判断待处理信号是语音还是非语音,从输入信号中找到语音部分的起止点,端点检测是语音识别,语音增强以及语音编码等中的一个重要环节[3]。
1.2语音端点检测研究意义
语音端点检测最早的应用是在贝尔实验室开发的电话传输和转换系统中,用于通信信道的时间分配,通过语音端点检测实现在空闲的信道插入其它的话音信息,之后,各种各样的语音端点检测算法在自动语音识别,说话人确认,回声消除,语音编码和其
文档评论(0)