网站大量收购独家精品文档,联系QQ:2885784924

梅尔倒频谱mel-.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
梅尔倒频谱mel-

梅爾倒頻譜係數 (Mel-frequency cepstral coefficients) 大綱 倒頻譜 人類聽覺特性 梅爾倒頻譜 倒頻譜 語音訊號可如下表示: 其中,X(n)為語音訊號 θ(n)為音源訊號 E(n)為聲道的脈衝響應信號 倒頻譜 語音訊號之頻域表示方式: 倒頻譜 對頻域的語音訊號加上絕對值與對數 在對取完絕對值與對數的訊號,進行逆傅立葉轉換, 所對應的ce(n)會落在n值較大的地方,而 所對應的cθ(n)會存在n值較小處 倒頻譜 人類聽覺特性 人類在分辨聲音時,是取決於頻域上的解析度,能否聽見聲音或分辨聲音是取決於音強(Intensity)與頻譜(Spectrum) 人類聽覺特性 人類聽覺上的兩個重要特性―遮蔽效應、臨界頻帶 當某一頻率的聲音,有一特定音強存在,另一個不同頻率的聲音要將音強提高,才會被聽見,這就是遮蔽效應(Masking Effect) 遮蔽效應有兩種現象,一名為頻率遮蔽(Frequency Masking),另一名為時間遮蔽(Temporal Masking) 人類聽覺特性 同時存在的聲音,常常是低頻的聲音傾向於遮蔽高頻的聲音 人類聽覺特性 聲音在聽覺器官中,傳遞時間延遲所造成的遮蔽現象,稱時間遮蔽 人類聽覺特性 當我們改變窄頻帶聲音刺激(narrowband sound stimulus)時,其聲音成分若跨越某一頻率,則聽覺上會感到有差異,而在一頻率範圍內,則感覺不到差異,這個頻率範圍稱臨界頻帶(Critical Band) 在人類聽覺範圍內,可以分成24個臨界頻帶 人類聽覺特性 人類聽覺特性 巴克度量(Bark Scale)又稱臨界頻帶率(Critical-Band Rate),它將聲學上的頻率與感知上的頻率解析度對照起來,其公式如下 其中B(f)為臨界頻率帶 人類聽覺特性 巴克量度的轉換曲線 梅爾倒頻譜 與巴克量度相似的梅爾量度(Mel Scale),其公式如下: 或是 梅爾倒頻譜 梅爾量度的轉換曲線 梅爾倒頻譜 梅爾倒頻譜流程圖 梅爾倒頻譜 梅爾三角濾波器組 梅爾倒頻譜 在Filtering步驟,先對頻域訊號進行平方運算以得到頻率能量 將頻率能量乘上梅爾三角濾波器組,並累加起來 其中J為濾波器的數量 為第j個濾波器 梅爾倒頻譜 其公式為: 執行DCT,其公式為: 其中,L為MFCC的維度 * *

您可能关注的文档

文档评论(0)

wangyueyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档