语音识别的技术介绍.pptVIP

下载本文档

60
0
约1.12万字
约 34页
2017-04-01 发布于北京
举报
版权申诉

语音识别的技术介绍.ppt

1、本文档共34页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语音识别的技术介绍

语音信号处理与识别为了减小语音帧的截断效应，需要加窗处理：矩形窗： Hamming： Hann：语音模板及相似性判断方法模式匹配方法基于随机过程理论的HMM模型人的言语过程实际上就是一个双重随机过程，语音信号本身是一个可观测的时变序列，是由大脑根据语法知识和言语需要(不可观测的状态)发出的音素的参数流。HMM合理地模仿了这一过程，它对语音信号的时间序列建立统计模型，很好地描述了语音信号的整体非平稳性和局部平稳性，是较为理想的一种语音模型。基于神经网络识别法人工神经网络(ANN)本质上是一个自适应非线性动力学系统，模拟了人类神经活动的原理，具有自适应性、并行性、鲁棒性、容错性和学习特性，其强的分类能力和输入一输出映射能力在语音识别中都很有吸引力。但由于存在训练、识别时间太长的缺点，目前仍处于实验探索阶段。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. * * 一、语音识别概述二、语音识别系统基本原理三、预处理及特征参数提取四、模板匹配技术及相似性判断方法五、语音识别系统的设计和实现 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 语音识别概述让机器听懂人类的语音，这是人们长期以来梦寐以求的事情。伴随计算机技术发展，语音识别己成为信息产业领域的标志性技术，在人机交互应用中逐渐进入我们日常的生活，并迅速发展成为“改变未来人类生活方式厅的关键技术之一。语音识别技术以语音信号为研究对象，是语音信号处理的一个重要研究方向。其最终目标是实现人与机器进行自然语言通信。发展和现状： 20世纪50年代，ATT Bell(贝尔)研究所成功研制了世界上第一个能识别10个英文数字的语音识别系统一Audry系统，这标志着语音识别研究的开始。 60年代计算机的应用推动了语音识别的发展。这一时期的重要成果是动态规划(Dynamic Programming, DP)和线性预测分析(Linear Predictive)技术。其中后者较好的解决了语音信号产生的模型问题，对语音识别产生了深远的影响。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 语音识别概述 70年代语音识别领域取得了突破。在理论上，LP 技术得到进一步发展，动态时间规整技术(DTW)的基本成熟，特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在实践上，小词汇量孤立词的识别方面取得了实质性的进展，实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。这一时期的语音识别方法基本上是采用传统的模式识别策略。 80年代语音识别研究进一步走向深入，其显著特征是HMM模型和人工神经元网络(ANN)在语音识别中的成功应用。HMM模型的广泛应用应归功于ATT Bel实验室的Rabiner等科学家的努力，他们把HMM纯数学模型工程化，从而为更多研究者了解和认识。研究的重点逐渐转向大词汇量、非特定人连续语音识别。 90年代，随着多媒体时代的来临，在语音识别技术的应用及产品化方面出现了很大的进展。许多发达国家如美国、日本、韩国以及IBM，Apple，ATT,NTT等著名公司都为语音识别系统的实用化开发投以巨资。语音识别技术实用化进程大大加速，并出现了许多实用化产品。 IBM公司率先推出的汉语ViaVoice语音识别系统，带有一个32,000词的基本词汇表，可以扩展到65,000词，平均识别率可以达到95%，可以识别上海话、广东话和四川话等地方口音，是目前具有代表性的汉语连续语音识别系统。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 语音识别概述 21世纪语音识别技术的应用及产品化方面进一步发展。在语音识别产品方面，各大公司纷纷推出自己产品。目前世界上最先进的语音识别