短时能量 过零率.doc

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音识别系统的端点检测算法研究 西南林学院2004届本科毕业论文 PAGE 10 PAGE 9 1 前言和开发背景 1.1前言 本课题为给语音识别系统提供语音信号端点检测的功能,对语音信号端点检测进行了探讨和研究。语音信号处理部分包括:语音信号的电压放大、反混叠滤波、自动增益控制、模/数变换、去除声门激励及口唇辐射的影响等。本课题主要是侧重语音区间的端点检测,端点检测的目的是从包含语音的一段信号中确定出语音的起点以及终点。为了实现可靠的端点检测,在算法Vad中主要应用了短时能量和过零率两者配合实现,并且在端点检测的过程中采取四个阶段标识语音信号的状态来实现的。对大象声音进行录制和处理,利用MATLAB软件进行端点检测,MATLAB软件是语音识别系统中有效,方便的工具,提供了强大的科学运算、灵活的程序设计流程、高质量的图形可视化与界面设计、便捷地与其他程序和语言接口的功能。结果表明,基于端点检测算法Vad和应用MATLAB工具,可以有效确定语音的起点和终点,并能够以图像的形式直观的表示出来,端点检测使处理时间减到最小,排除无声段的噪声干扰,从而使识别系统具有良好的识别功能[1]。 1.2开发背景 本项目来源于云南省重点项目西双版纳自然保护区系统建设。综合应用传感器技术,数字仿真技术,数据编码与数据压缩技术,DSP技术,无线传输技术等,研究自然保护区视频信号、声音信号以及其他监测信号的采集、传送、处理方案,设备选型方案,二次开发技术,为自然保护区信息系统建设。本课题重点是语音识别系统的开发与研究,侧重于语音识别系统的语音信号的端点检测。 本课题研究的目的在于为开发一个能够识别野象声音的语音识别系统提供语音信号的端点检测功能,端点检测在语音识别系统中有重要地位,是语音识别系统中不可缺少的一部分,也是预处理中很重要的一个环节,这个功能使处理时间减到最小,排除无声段的噪声干扰,从而使识别系统具有良好的识别功能,提高语音识别系统的识别效率和准确率。研究的内容是:首先录制大象的声音,并处理声音文件达到MATLAB识别的扩展名为wav的声音文件格式,在声音时间上也要有控制。然后对端点检测的核心算法vad进行探讨和研究,主要运用了短时能量和过零率两者配合实现可靠的端点检测,并对其中参数进行一步探讨。 2 语音信号端点检测概述 2.1语音识别系统简介 在做本课题的过程中,采用的是非实时的处理方法,在录音时必须声音进行声音控制。在一个语音识别系统中,程序必须能够判断当前是静音还是对象在说话,如果对象发出了语音信号,那么应该保存这段语音信号,将其头部和尾部的静音部分删除掉。这一功能被称为语音信号的端点检测[2]。 语音识别系统是建立在一定的硬件平台和操作系统之上的一套应用软件系统。其硬件平台一般是一台个人机或是一台工作站;操作系统可以选择UNIX或WINDOWS系列。语音识别一般分两个步骤。第一步是系统“学习”或“训练”阶段。这一阶段的任务是建立识别基本单元的声学模型以及进行文法分析的语言模型等。第二步是“识别”或“测试”阶段。根据识别系统的类型选择能够满足要求的一种识别方法,采用语音分析方法分析出这种识别方法所要求的语音特征参数,按照一定的准则和测度与系统模型进行比较,通过判决得出识别结果。 语音识别 语音识别 A/D变换 话筒 语音信号输入 电话 端点检测 参数分析 动作 应用(Application) Vad算法 图1语音识别系统的组成框图 语音识别系统,除了包括核心的识别程序,还必须包括语音输入手段、参数分析、标准声学模型、词典、文法语言模型等,以及制作这些东西所需的工具。根据识别结果在实际环境下实现一定的应用,还必须考虑耐环境技术,用户接口输入和输出技术等。因此,语音识别技术加上各种外围技术的组合,才能构成一个完整的实际应用的语音识别系统。从语音识别系统的各个功能划分的角度出发,语音识别系统可分为语音信号的预处理部分、语音识别系统的核心算法部分以及语音识别系统的基本数据库等几部分。图1给出了一般语音识别系统的组成框图[5]。 图1给出了一般语音识别系统的组成框图。识别预处理的过程主要是对通过话筒或电话线路输入的语音信号进行数字化采样、在语音检测部切出语音区间、经过语音分析部变换成特征向量,在语音识别部根据单词字典和文法的约束进行语音特征向量时间序列和语音声学模型的匹配输出识别结果,然后或直接把识别出的单词或由单词列组成的句子输出给应用部分(Application),或把识别结果转接成控制信号,控制应用部分的动作[3]。 2.2语音信号的端点检测在语音识别系统中的地位和作用 端点检测的目的是从包含语音的一段信号中确定出语音的起点以及终点。有效的端点检测不仅能使处理时间减到最小,而且能排除无声段的噪声干

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档