关于语音信号处理技术及应用探讨.docVIP

关于语音信号处理技术及应用探讨.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于语音信号处理技术及应用探讨

关于语音信号处理技术及应用探讨   当今世界正处于工业时代向信息时代的飞速转变时刻,语音在人类社会中起了非常重要的作用。随着电子购物、因特网络的普及、多媒体通信及其应用的蓬勃发展,语音始终是人类互相交流、互相通信的最主要、方便、快捷的信息载体。   一、语言信号处理及技术的发展   随着科学技术的快速发展,语音信号处理取得了重大的进展:   20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换等是语音信号数字处理的理论和技术基础。   70年代后期提出了用于语音信号的信息压缩和特征提取的线性预测技术,并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法。   80年代初一种新的基于聚类分析的高效数据压缩技术―矢量量化应用于语音信号处理中;而用隐马尔可夫模型描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HMM已构成了现代语音识别研究的重要基石。   目前,人工神经网络的研究取得了迅速发展,它的许多成果也体现在有关语音信号处理的各项技术之中。   二、语音信号处理技术概述   语音信号处理是综合性的多学科领域和涉及面很广的交叉学科。它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。   语言信号处理大都采用数字计算机技术,所以又称为语言数字处理。语言信号处理的研究起源于对发音器官的模拟,即建立发音过程的数字模拟系统,亦即声道数字模型的研究。利用这一模型,可对语言信号进行分析与合成,借以发展各种通信频带压缩技术和必威体育官网网址通信的新体制。在语言分析合成的基础上,研制出了各种语言自动识别装置,赋予计算机以听觉功能。语言的信息主要包含在语言信号的参数之中。因此,准确而迅速地提取语言信号的参数是进行语言信号处理的关键。常用的语言信号参数有:共振峰频率、音调和嗓音噪声的判别等。这类参数仅反映发音过程的一些平均特性,而实际语言的发音变化相当迅速,需用非平稳的随机过程来描述。因此,研究语言???号动态的非平稳的参数分析方法得到迅速发展。   三、语音信号处理技术的应用   语言信号处理的研究应用于工业中,话控技术可提高生产的自动化水平,提高生产效率;医疗部门可通过语言信号处理对聋哑病人进行病情诊断。公安部门可利用发音特征的鉴别对作案人进行鉴定;国防部门能实现高必威体育官网网址通信,还可实现指挥员直接口呼命令;其中最重要应用包括语音编码、语音合成、语音识别以及语音增强等。   (一)语音编码   目前语音编码分为三类:波形编码、参量编码和混合编码。主要应用在通信领域。语音信号的传输和存储是语言信号的基本要求。对语音信号的传输,希望是传输的速度快,传输的质量高;对语音信号的存储,希望存储的空间小,存储的信息多。这两个方面的要求,促进了语音编码的产生。语音编码算法可以解决语音传输和存储的问题。所以,语音编码具有十分重要的价值,是目前语音信号处理最广泛的算法。   (二)语音合成   语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息。   (三)语音识别   语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。   语音识别的应用领域非常广泛,常见的应用系统有:语音输入系统、语音控制系统、语音拨号系统、智能对话查询系统等等。   (四)语音增强   语音增强是语音信号处理的重要应用之一。由于人们在语音通信过程中不可避免地会受到来自周围环境、传输媒介引入的噪声,通信设备内部电噪声,乃至其它讲话者的干扰。这些干扰最终将使接收者接受到的语声已非纯净的原始语音信号,而是受噪声污染的带噪语音信号。语音增强技术就成为数字语音信号处理中的重要组成部分。   所谓语音增强就是对带噪语音进行处理,以改善语音质量。提高语音的清晰度、可懂度和舒适度,使人易于接受或提高语音处理系统的性能。大多数实用的语音增强系统均是由精确的噪声估计器和良好的滤波器来实现对带噪语音进行去噪。所以,研究语音增强具有十分重要的价值,无论在民用还是在军用都有非常大的应用前景。   (五)潜在的语音信号处理应用   语音信号处理在手持设备、移动设备和无线个人设备中的应用正在不断增加。语音

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档