语音分析与语音处理.pdfVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

语音与语音信号

语音是人类获取信息的重要来源和利用信息的重要手段。语音信号处理是一门发展十分迅速、应用非

常广泛的前沿交叉学科,同时又是一门跨学科的综合性应用研究领域和新兴技术。现代语音信号系统包括

语音信号采集单元和语音信号处理单元。

语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同

时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来自信号信息处

理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等学科也有非常密

切的联系。

从技术角度讲,语音信号处理是信息高速公路、多媒体技术、办公自动化、现代通信及智能系统等新

兴领域应用的核心技术之一。在高度发达的信息社会用数字化的方法进行语音的传送、存储、识别、合成、

增强等是整个数字化通信网中的重要组成部分之一。同时,语言不仅是人类相互间进行沟通的最自然和最

方便的形式,也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为计算机、

自动化系统等建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化和

自动化程度。

其中语音信号处理的一个重要的部分是频谱分析。有趣的是,人类对变化的频率比对变化的本身更要

敏感得多。人耳对声音敏感的不是声波本身而是声波的频率,例如男声、女生和低音、高音等。所谓频谱

分析就是周期性分析,频谱估计就是周期性估计。频谱分析和估计不仅是揭示信号特征的重要方法,也是

处理信号的重要手段。这些方法和手段己经广泛地应用于通信、雷达、地震、生物医学、物理、化学、音

乐、经济等领域。如此广泛的应用主要归功于数字信号处理(DSP)理论和技术的进步。自从1965年图基

(J.W.Tuky)和库利(T.W.Coody)在《计算机数学》杂志上发表了著名的《机器计算傅立叶级数的一种算

法》论文后,桑德(G.Sand)——图基等快速算法相继出现,由经人们进行改进,很快形成一套高效运算

方法,这就是现在的快速傅立叶变换,简称(FFT)。由于实现方法的限制,这些理论还得不到广泛得应用。

直到20世纪80年代,世界上第一片单片可编程DSP(数字信号处理)芯片的诞生,才将理论研究成果广

泛应用到低成本的实际系统中,并且推动了新的理论和应用领域的发展,并为各式各样的频域问题,提供

了一个统一的、经济的、单片继承的解决办法。

2.1语音信号的特点

构成人类语音的是声音,然而这是一种特殊的声音,是由人讲话所发出的声音。语音是由一连串的音

所组成。语音具有被称为声学特征的物理性质。语音中的各个音的排列由一些规则所控制,对这些规则及

其含意的研究属于语言学的范畴,而对语音中音的分类和研究则称为语音学。

语音既是人的发音器官发出来的一种声波,它就个其他各种声音一样,也具有声音的物理属性。它具

有以下一些特性:

①音质。它是一种声音区别与其他声音的基本特征。

②音调。就是声音的高低。音调取决于声波的频率:频率快则音调高,频率慢则音调低

③声音的强弱。音强及音量,又称响度。它是由声波振动幅度决定的。

④声音的长短。也称音长,它取决于发音持续时间的长短。

语音信号最主要的特性是随时间而变化的,是一个非平稳的随机过程。但是,从另一方面看,虽然语

音信号具有时变特性,但在一个短时间范围内其个性基本保持不变。这是因为人的肌肉运动有一个惯性,

从一个状态到另一个状态的转变是不可能瞬间完成的,而是存在一个时间过程。在没有完成状态转变时,

可从近似认为它不变。只要时间足够短,这个假设是成立的。在一个较短的时间内语音信号的特征基本保

持不变,这是语音信号处理的一个重要出发点。因而我们可以采用平稳过程的分析处理方法来处理语音。

2.2语音信号处理的主要方式

根据所分析的参数不同,语音信号分析又可分为时域、频域、倒频域等方法。时域分析具有简单、运

算量小、物理意义明确等优点;但更为有效的分析多是围绕频域进行的,因为语音中最重要的感知特性

反映在其功率谱中,而相位变化只起很小的作用。傅立叶分析在信号处理中具有十分重要的作用,它是

分析线性系统和平稳信号稳态特性的强有力手段,在许多工程和科学领域得到了广泛的应用。这种以复

指数函数为基函数的正交变换,理论上和完善,计算上很方便,概念上易于理解。傅立叶分析能是信号

的某些特性变得很明显,而在原始信号中这些特性可能没有表现出来或至少不明显。

然而,语音波

文档评论(0)

186****8151 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档