[语音信号处理综述.docxVIP

下载本文档

31
0
约5.45千字
约 9页
2017-01-20 发布于北京
举报
版权申诉

[语音信号处理综述.docx

1、本文档共9页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

[语音信号处理综述

语音信号处理综述摘要：随着信息技术的发展，语音信号处理技术不断地融入到各个领域。作为21世纪信息技术领域最重要的科学技术之一，它成为了人机接口的关键技术，并且越来越受到人们的重视。本文介绍了国内外语音技术的相关发展及该技术在通讯，家具，导航等领域的应用。并对他们的语音技术的优缺点进行了总结。关键词：语音技术通讯Review of Speech Signal ProcessingAbstract: With the development of information technology, the Automatic Speech Recognition (ASR) constantly into the fields. The ASR which is one the most important technology in information fields and it is the key technology of the man-machine interface, and which is more and more appreciated by people. The text introduces the development and application in communication, household and navigation of the ASR. I summer the advantages and disadvantages of their ASR.Key words: ASR communication研究语音信号处理技术的背景及其意义随着人们进入信息时代，人们的生活、学习、工作领域也越来越智能化。作为人和这些领域沟通的关键接口，语音信号处理技术自然引起里人们的足够重视。该技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高级技术。通过该技术人们可以不通过键盘的输入过程而直接通过语音进行操作，并且语音技术的应用已经成为一个具有竞争性的新兴高技术产业。如今，语音技术相关产品已经成为了我们生活的一部分，它的作用越来越被重视，人们对当前语音技术的提高也是越来越期待。二、语音处理系统的分类（1）按发音方式分为孤立词、连接词和连续语音的语音识别系统。语音识别系统可能要求说话者以单字、单词、或是短语为发音单位，其间就必须要略微停顿，否则识别就会有问题。以前的语音识别系统，几乎都是以单字或单词为单位的孤立语音识别系统，随着连续语音识别技术渐趋成熟，连续词和连续语音这个最自然的说话方式，将成为语音识别系统的主流。（2）按词汇量大小分为小词表、中词表和大词表以及无限词汇量语音识别系统。如果语音识别系统只为你进行电话拔号，那它只要能听懂10个数字就行了，这属于小词汇量语音识别系统；如果它是为你自动转接话务，那它还应识别单位名、人名和时间等成千上百的词和字，这属于中等词汇量语音识别系统；如果它是把1篇口述的演讲报告转换成为文字，这属于大词汇量语音识别系统。（3）按说话人适应范围分为特定人、限定人和非特定人语音识别系统。特定人系统是指系统在使用前必须由用户输入大量的发音数据、对其进行训练。非特定人系统则试图达到在系统构建成功之后，用户需要事先输入大量的训练数据，即可使用的目的。语音信号处理技术研究现状语音识别的研究工作可以追溯到20世纪50年代ATT贝尔实验室的系统，它是第一个可以识别十个英文数字的语音识别系统。但真正取得实质性进展，并将其作为一个重要的课题开展研究则是在60年代末70年代初。这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能，更重要的是语音信号线性预测编码（LPC）技术和动态时间规整（DTW）技术的提出，有效的解决了语音信号的特征提取和等长匹配问题。这一时期的语音识别主要基于模板匹配原理，研究的领域局限在特定人，小词汇表的孤立词识别，实现了基于线性预测倒谱和DTW技术的特定人孤立词语音识别系统；同时提出了矢量量化(VQ)和马尔可夫模型(HMM)理论。随着应用领域的扩大，小词汇表、特定人、孤立词等这些对语音识别的约束条件需要放宽，与此同时也带来了许多新的问题：第一，词汇表的扩大使得模板的选取和建立发生困难；第二，连续语音中，各个音素、音节以及词之间没有明显的边界，各个发音单位存在受上下文强烈影响的协同发音（Co-articulation）现象；第三，非特定人识别时，不同的人说相同的话相应的声学特征有很大的差异，即使相同的人在不同的时间、生理、心理状态下，说同样内容的话也会有很大的差异；第四，识别的语音中有背景噪声或其他干扰。因此原有的模板匹配方法已不再适用。实验室语音识别研究的巨大突破产生于20世纪80年代末：人们终于在实验室突破了大词汇量、连续语音和非特