语音信号产生的数字模型.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
声调的变化就是浊音基音周期的变化,为了将调值描写地具体一些,一般采用“五度标记法”,用一条竖线表示声音的高低,从上而下用1、2、3、4、5依次表示低、半低、中、半高、高。 5 高 4 半高 3 中 2 半低 1 低 阴平 阳平 上声 去声 调类 阴平 阳平 上声 去声 调值 55 35 214 51 第三十七页,共58页。 四、语音信号的统计特性 语音信号振幅分布的概率密度有两种逼近方法: 修正伽玛(Gamma)分布概率密度函数: 拉谱拉斯(Laplace)分布概率密度函数: 第三十八页,共58页。 第三十九页,共58页。 人类接收语音由人耳来完成,空气振动由耳廓收集,经外耳道而抵达鼓膜,鼓膜随之振动,使鼓室中的空气和听骨链也发生振动,听骨链的振动经前庭窗(卵圆窗)激励前庭淋巴,变为液波,液波使位于基底膜上的螺旋器受到刺激,将神经冲动经听神经传到中枢而产生听觉。 §2.5 人类的听觉功能 第四十页,共58页。 正常人的听觉系统是极为灵敏的,可听声的范围为20Hz-20kHz。 可听声的最小声压级(dB)称为听阈。-5~130dB,对低频和高频是不敏感的,听阈为60dB,在1kHz附近最敏感。 第四十一页,共58页。 当说话时,声带在软骨的作用下相互靠近但不完全闭合,声门变成一条窄缝,当气流通过窄缝时压力减小,外界压力大,从而两片声带完全闭合使得气流不能通过,当气流阻断时压力恢复正常,推开两片声带,声门再次打开,气流再次流过。 声带靠拢 Tp 基音周期 声带的开启和闭合称为振动。这一振动过程周而复始,形成了一串周期性脉冲气流送入声道。这个过程发出的音称为浊音。如汉语发音的[a]、[i]、[u]和[o]等。 第五页,共58页。 Glottal Closure instant T 第六页,共58页。 女声汉语拼音a的时域波形 第七页,共58页。 Tp 基音周期 fundamental period Voiced excitation Unvoiced excitation(声带不振动,声门开启) 第八页,共58页。 男声汉语拼音声母s的时域波形 第九页,共58页。 气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,期间的传输通道称为声道。气流流过声道时犹如通过了一个具有某种谐振特性的腔体,放大某些频率,在频谱上形成相应位置的峰起,称为共振峰。 讲话时,由于舌和唇的连续运动,使声道形状改变,随即改变谐振频率,使得发不同的音。声道的不同的形状,对应不同的谐振频率。 声道 第十页,共58页。 发音的三种方式-excitation 浊音(voiced sounds)声带开启和闭合,在声门处产生一个准周期性脉冲序列。(quasi-periodic sequence) 清音(unvoiced sounds)声带完全舒展开来,声道的某个部位发生收缩形成了一个狭窄的通道,当空气流到达此处时被迫以高速冲过收缩区,并在附近产生空气的湍流,类似于白噪声。(white noise) 爆破音(plosive/stop sounds)声带完全舒展开来,声道的某个部位完全闭合在一起,当空气流到达时便在此处建立起空气压力,一旦闭合点突然开启便会让气压快速释放,实际上也是一种空气的湍流。(white noise) 第十一页,共58页。 ☆ F0 =1/Tp,基音频率,由声带的质量来决定。 ☆ F0的大小决定了声音的高低,称为音高。 ☆ 男性的F0大致分布在: 50~250Hz ☆ 女性和儿童的F0大致分布在:100~500Hz 基音频率(Fundamental Frequency-pitch)F0 第十二页,共58页。 鼻端 嘴唇 17cm 8.5cm 13cm 声道的无损模型 声道的谐振频率format frequency 谐振频率发生在:Fn= (声道的横截面是均匀的,发元音e时,声道近似是均匀的。) L=17cm,声道的长度 n=1,2,3 … 称为第一共振峰F1=500Hz 、第二共振峰F2=1500Hz 、第三共振峰F3=2500Hz ,… c=340m/s 2n-1 4L c 第十三页,共58页。 基音频率 输出气流的频率 共振峰频率 女声英文a的频谱 第十四页,共58页。 男声汉语拼音声母s的频谱 第十五页,共58页。 ? 一种声道形状对应一套共振峰 ? 不同人的声道大小不同,共振峰不同 ? 同一人,发不同音,共振峰也不同 总结 前三个共振峰的大致范围(Hz) 共振峰

文档评论(0)

努力奋斗的小玲 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档