- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
语⾳信号处理第⼀章绪论
第⼀章绪论
1、语⾳信号?
语⾳信号是具有声⾳的语⾔,⼈类表⽰信息的常⽤媒体,⼈类通信的有效⼯具。
2、语⾳信号包含的信息?
1)说话内容,说什么;2)说话⼈⾝份,谁说的;3)说话⼈说话时的状态,⽣理状态、⼼理状态、情绪等。(语⾳信号处理
主要关⼼前两项)
3、为什么要学习和研究语⾳信号处理技术?
答:1)语⾳是⼈类最重要、最有效、最常⽤和最⽅便的交换信息的⽅式;2)让计算机能够理解⼈类的语⾔,是⼈类⾃计算
机诞⽣以来就梦寐以求的想法;随着计算机的便携化,⼈们渴望摆脱键盘的束缚⽽代之以语⾳输⼊的⽅式。⽐如苹果公司的
iphone⼿机,在其必威体育精装版版本4s中,推出了siri功能-即语⾳助⼿,可以通过语⾳输⼊,让其充当闹钟,⽐如还可以让它为你找出
最近的咖啡厅,另外找出⾏路线往往需要输⼊不少⽂字,省事的话,报出地点,它可以调⽤google地图来找出出⾏⽅案,还
可以让它播放⾳乐,发送短信等等。3)语⾳信号技术始终与当时信息科学最活跃的前沿科学保持密切联系,并且⼀起发展。
语⾳信号处理是以语⾳语⾔学和数字信号处理为基础的涉及多⽅⾯的综合性学科,它与⼼理学、⽣理学、计算机科学、通信与
信息科学以及模式识别和⼈⼯智能等学科都有着密切的关系。对于语⾳信号处理的研究⼀直是数字信号处理技术发展的重要推
进⼒量,⽽数字信号处理许多新⽅法的提出,⼜是⾸先在语⾳信号处理中获得成功,⽽后再推⼴到其他领域的。⽐如,语⾳信
号处理算法的复杂性和实时处理的要求,促进了⾼速信号处理器的设计。⽽这些产品产⽣之后,⼜是⾸先在语⾳信号处理中得
到最有效的应⽤的。
4、语⾳信号处理的发展情况
1)语⾳信号处理的发展标志是在1940年产⽣的通道声码器技术,该技术打破了以往的波形原则“”,提出了⼀种全新的语⾳通
信技术,即从语⾳中提取参数加以传输,在接收端重新合成语⾳。其后,产⽣了语⾳“参数模型的“思想。
2)40年代后期,研制成功了语“谱仪”,为语⾳信号分析提供了有⼒的⼯具。
3)50年代后,语⾳信号处理得到了新的进展。主要标志是贝尔实验室的英⽂数字语⾳识别装置的成功研究。其后随着数字计
算机和数字信号处理技术(FFT)的突破性发展,产⽣了第⼀台孤⽴词语⾳识别器,有限连续语⾳识别器。
4)70年代初,随着倒谱分析技术和线性预测技术的成功应⽤,微电⼦学、微处理芯⽚和专⽤信号处理芯⽚的不断问世,进⼀
步推动了语⾳信号处理技术的发展。
5)80年代初,⽮量量化VQ应⽤于语⾳信号处理,隐马尔可夫模型HMM是80年代语⾳信号处理技术的重⼤发展。
6)近年来,⼈⼯神经⽹络研究取得了迅速的发展,语⾳识别是神经⽹络的⼀个重要应⽤领域。
5、语⾳信号处理的应⽤
1)语⾳编码(语⾳压缩编码,语⾳压缩)
必要性:数字化语⾳信号的存储要占⽤⼀定的空间,传输时占⽤⼀定的带宽。为了节省空间和带宽需要对语⾳信号进⾏压缩编
码。如果按照传统的模数转换技术对语⾳信号进⾏数字化,必须传输或存储⼤量的数据。如假设采样速率为8kHz,对每个样
本进⾏16位A/D转换,那么每秒的语⾳数据量将达到128kbps,如此⾼的位率是不允许的,所以必须对其进⾏压缩。
它的发展现状是:⾃从30年代末提出了PCM(脉冲编码调制)原理以及声码器的概念后,语⾳编码⼀直沿着两个⽅向进⾏发
展:语⾳信号波形编码和声码化编码,或者是⾮参数化编码与参数化编码。参数编码有时⼜称为模型编码。(1)波形编码:
特点是⼒图使重建的语⾳波形保持原始语⾳信号的波形形状,这类编码器通常将语⾳信号当做⼀般的波形信号来处理具有适应
能⼒强,话⾳质量好等优点,但是所需要的编码速率⾼。如:PCM,增量调制,⾃适应增量调制等。(2)参数编码:通过对语
⾳信号特征参数的提取及编码,⼒图使重建的语⾳信号具有尽可能⾼的可懂度,即保持原语⾳的语意,但是重建信号的波形同
原语⾳信号的波形相⽐可能有很⼤的差别。参数编码的主要问题是合成语⾳质量低,⾃然度较差,有时甚⾄连熟⼈也不⼀定能
听出说话⼈是谁。另外,这类编码器对说话的环境⽐较敏感,需要安静的环境才能给出较⾼的可懂度。如:线性预测声码器
等。(3)混合编码:克服了原有波形编码和参数编码的弱点,结合了各⾃的长处,在4~16kbps速率上能够得到质量较好的合成
语⾳,在本质上具有波形编码的优点。如:多脉冲激励线性预测编码,规则脉冲线性激励预测编码,码本激励线性预测编码
等。
应⽤范围包括:带宽受限信道的数字话⾳传输(蜂窝移动通信,卫星通信等),可视电话,语⾳的数字存储,呼叫服务(数字录
⾳,语⾳信箱等)。
⽅向:低码率、⾼质量的⾳频编
文档评论(0)