方法改进：MFCC-三角带通滤波器.PPT

下载文档 降价啦

43
0
约8.47千字
约 58页
2017-08-05 发布于天津
举报
版权申诉
保障服务

方法改进：MFCC-三角带通滤波器.PPT

1、本文档共58页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

方法改进：MFCC-三角带通滤波器

32位元處理器之定點數MFCC演算法的改進與探討Improvement and Discussion of MFCC Algorithm on 32-bit Fixed-point Processors 學生:陳奕宏指導教授：張智星 Outline 研究簡介參考資料與相關研究基礎理論方法改進實驗數據與分析結論及未來工作研究簡介嵌入式語音之應用：手機上聲控撥號系統嵌入式語音學習軟體 Smart Phone 與PDA 上的語音辨識 PMP (Portable Multi-media Player) 上的語音辨識與控制研究簡介實作上的困難嵌入式系統上的記憶體容量相對於PC來的小嵌入式系統上的處理器 (CPU) 運算時脈較低嵌入式系統上並未搭載浮點運算器 (FPU) 演算法由浮點資料型態更改為整數型態時，所造成的誤差參考資料與相關研究 Jia-Ching Wang, Jhing-Fa Wang, Yu-Sheng Weng, “Chip design of MFCC Extraction for Speech Recognition”, INTEGRATION, the VLSI journal 32 (2002) 111–131 Soontorn Oraintara, Ying-Jui Chen, Trunong Q. Nguyen, “Integer Fast Fourier Transformation”, IEEE Transactions on Signal Processing, Vol. 50, NO.3, March 2002 Po-Chien Hsueh, Jyh-Shing Roger Jang, “Embedded Speech Recognition”, Master Thesis, July 2004 Chin-Lung Hart Su, Jyh-Shing Roger Jang “Speech Recognition on 32-bit Fixed-point Processors: Implementation Discussions”, Master Thesis, July 2005 基礎理論：語音特徵參數擷取常見的語音特徵參數擷取的方法：線性預測編碼 (Linear Predictive Coding) 梅爾倒頻譜係數 (Mel-Scale Frequency Cepstral Coefficients) 基礎理論：MFCC 流程基礎理論：MFCC-音框化與取能量音框化人類的語音訊號在20ms~30ms會呈現半穩態取音框大小320個訊號點，重疊範圍160個訊號點，作為一個語音特徵之觀測單位計算能量計算每一個音框的能量，作為MFCC第13個參數取能量數學式：基礎理論：MFCC-預強調消除並補償聲帶與嘴唇所產生壓抑高頻的效應凸顯高頻的共振峰預強調數學式：基礎理論：MFCC-漢明窗增加音框與音框間的左右連續性避免往後作快速傅立葉轉換 (FFT)產生較多的訊號，導致分析上的誤差及錯誤產生漢明窗數學式：基礎理論：MFCC-快速傅立葉轉換將在時域上的訊號轉換成頻率域，使得我們較容易從能量的分佈來觀測語音訊號的特性離散傅立葉轉換(DFT)數學式：快速傅立葉轉換，則運用DFT中有複數對偶之特性，來加速運算基礎理論：MFCC-三角帶通濾波器與計算對數能量梅爾頻率數學式：將FFT後所得的能量頻譜，乘上一組M個的三角帶通濾波器來降低資料維度將所得M個頻帶能量計算ln，取得對數能量基礎理論：MFCC-離散餘弦轉換離散餘弦數學式： 26維的資料由頻率域轉成時域上12維的資料運算量較IDFT低基礎理論：MFCC-差量倒頻譜差量倒頻譜數學式：運用兩次差量計算出Delta與Acceleration參數，來表示MFCC對於時間的變化方法改進：觀測語料資訊方法改進：MFCC-計算能量計算能量的數學式：避免資料溢位，我們將上述數學式子改寫為：方法改進：MFCC-計算能量-TCC300 sv 以e0, e2, …e8, 代入運算，得到TCC300語料發生資料溢位的機率方法改進：MFCC-計算能量-TIMIT sv 以e0, e2, …e8, 代入運算，得到TIMIT語料發生資料溢位的機率方法改進：MFCC-計算能量 TCC300計算能量： TIMIT計算能量： TIMIT 語料在錄製時音量較小，考量受測音訊有可能音量較大，因此我們取為403 方法改進：MFCC-預強調預強調數學式：將a放大214倍：預強調數學式改寫成：方法改