- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
语音识别技术的研究
摘要:随着计算机处理能力的迅速提高,语音识别技术得到了飞速发展,其技
术的应用正在日益改变着人类的生产和生活方式。本文介绍了语音识别的基本原
理、方法,综述了语音识别系统的分类及语音识别系统模型,并分析了语音识别
所面临的问题。
关键字:语音识别,应用,语音识别原理,语音识别系统
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自
动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过
程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很
广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及
神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信
息处理技术中的关键技术.语音技术的应用已经成为一个具有竞争性的新兴
高技术产业。其应用领域非常广泛,常见的应用系统有:语音输入系统,语
音控制系统,智能对话查询系统等。
1语音识别基础
1.1语音识别技术原理
语音识别系统本质上是一种模式识别系统。包括特征提取、模式匹配、
参考模式库等三个基本单元.它的基本结构如图所示:
未知语音经过话筒变换成电信号后加在识别系统的输入端首先,经过预处理.再
根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特
征,在此基础上建立语音识别所需的模板而。计算机在识别过程中要根据语音识
别的模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较根据,
一定的有哪些信誉好的足球投注网站和匹配策略,找出一系列最优的与输入语音匹配的模板然后根据此。
模板的定义,通过查表就可以给出计算机的识别结果显然。,这种最优的结果与
特征的选择、语音模型的好坏、模板是否准确都有直接的关系。
预处理是指在特征提取之前,先对原始语音进行处理,部分消除噪声和
不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。最常用
的预处理有端点检测和语音增强。端点检测是指在语音信号中将语音和非语
音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,
后续处理就可以只对语音信号进行,这对提高模型的精确度和识别正确率有
重要作用。语音增强的主要任务就是消除环境噪声对语音的影响。目前通用
的方法是采用维纳滤波,该方法在噪声较大的情况下效果好于其它滤波器。
1.2语音识别的方法
在训练阶段,用户将词汇表中的每一词依次说一遍,并且将其特征矢量
作为模板存入模板库。在识别阶段,将输入语音的特征矢量依次与模板库
中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。
目前具有代表性的语音识别方法主要有动态时间规整技术(DTW)、隐马尔可
夫模型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支持向量机(SVM)等方法。
(1)动态时间规整算法(DynamicTimeWarping,DTW)是在非特定人语音识别中
一种简单有效的方法。该算法基于动态规划的思想,将时间归正和距离测度计算
结合起来的一种非线性归正技术,是语音识别中的一种经典算法,该算法简单
有效,因此在实现孤立词识别系统中获得了广泛的应用。在应用DTW算法进行语
音识别时,就是将已经预处理和分帧的语音测试信号和参考语音模板进行比较以
获取他们之间的相似度,按照某种距离测度得出两模板间的相似程度并选择最佳
路径。
(2)隐马尔可夫模型(HMM)是语音信号处理中的一种统计模型,是由Markov链演
变来的,所以它是基于参数模型的统计识别方法。由于其模式库是通过反复训练
形成的与训练输出信号吻合概率最大的最佳模型参数而不是预先储存好的模式
样本,且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大
值所对应的最佳状态序列作为识别输出,因此是较理想的语音识别模型。
(3)矢量量化(VectorQuantization)是一种重要的信号压缩方法。与HMM相比,
矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是将若干个语音信
号波形或特征参数的标量数据组成一个矢量在多维空间进行整体量化。把矢量空
间分成若干个小区域.每个小区域寻找一个代表矢量,量化时落入小区域的矢量
就用这个代表矢量代替。矢量量化器的设计就是从大量信号样本中训练出好的码
书,从实际效果出发寻找到好的失真测度定义公式.设计出最佳的矢量量化系统,
用最少的有哪些信誉好的足球投注网站和计算失真的运算量实现最大可能的平均信噪比。
(4)人工神经网络(ANN)是20世纪80年代末期提
您可能关注的文档
最近下载
- 视觉与艺术智慧树知到期末考试答案章节答案2024年西安交通大学.docx
- 2024年四川省安全员《B证》考试题库及答案.doc VIP
- 《全国统一电力市场发展规划蓝皮书》.pdf
- 黄冈360°定制密卷一年级上册数学人教版.pdf
- 工程量清单编制中存在问题剖析.doc VIP
- 13SR425 室外热力管道检查井.docx VIP
- 山东省实验中学2024—2025学年高二上学期期中考试语文试题(解析版).docx VIP
- 石油和天然气的开采安全知识培训说课课件PPT.pptx VIP
- 综合管理部年度工作总结PPT.pptx VIP
- 大学日语 发展篇(西安交通大学)中国大学MOOC慕课章节测验答案(课程ID:1206146813).pdf
文档评论(0)