方法改进:MFCC-三角带通滤波器.PPT

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
方法改进:MFCC-三角带通滤波器

32位元處理器之定點數MFCC演算法的改進與探討 Improvement and Discussion of MFCC Algorithm on 32-bit Fixed-point Processors 學生:陳奕宏 指導教授:張智星 Outline 研究簡介 參考資料與相關研究 基礎理論 方法改進 實驗數據與分析 結論及未來工作 研究簡介 嵌入式語音之應用: 手機上聲控撥號系統 嵌入式語音學習軟體 Smart Phone 與PDA 上的語音辨識 PMP (Portable Multi-media Player) 上的語音辨識與控制 研究簡介 實作上的困難 嵌入式系統上的記憶體容量相對於PC來的小 嵌入式系統上的處理器 (CPU) 運算時脈較低 嵌入式系統上並未搭載浮點運算器 (FPU) 演算法由浮點資料型態更改為整數型態時,所造成的誤差 參考資料與相關研究 Jia-Ching Wang, Jhing-Fa Wang, Yu-Sheng Weng, “Chip design of MFCC Extraction for Speech Recognition”, INTEGRATION, the VLSI journal 32 (2002) 111–131 Soontorn Oraintara, Ying-Jui Chen, Trunong Q. Nguyen, “Integer Fast Fourier Transformation”, IEEE Transactions on Signal Processing, Vol. 50, NO.3, March 2002 Po-Chien Hsueh, Jyh-Shing Roger Jang, “Embedded Speech Recognition”, Master Thesis, July 2004 Chin-Lung Hart Su, Jyh-Shing Roger Jang “Speech Recognition on 32-bit Fixed-point Processors: Implementation Discussions”, Master Thesis, July 2005 基礎理論:語音特徵參數擷取 常見的語音特徵參數擷取的方法: 線性預測編碼 (Linear Predictive Coding) 梅爾倒頻譜係數 (Mel-Scale Frequency Cepstral Coefficients) 基礎理論:MFCC 流程 基礎理論:MFCC-音框化與取能量 音框化 人類的語音訊號在20ms~30ms會呈現半穩態 取音框大小320個訊號點,重疊範圍160個訊號點,作為一個語音特徵之觀測單位 計算能量 計算每一個音框的能量,作為MFCC第13個參數 取能量數學式: 基礎理論:MFCC-預強調 消除並補償聲帶與嘴唇所產生壓抑高頻的效應 凸顯高頻的共振峰 預強調數學式: 基礎理論:MFCC-漢明窗 增加音框與音框間的左右連續性 避免往後作快速傅立葉轉換 (FFT)產生較多的訊號,導致分析上的誤差及錯誤產生 漢明窗數學式: 基礎理論:MFCC-快速傅立葉轉換 將在時域上的訊號轉換成頻率域,使得我們較容易從能量的分佈來觀測語音訊號的特性 離散傅立葉轉換(DFT)數學式: 快速傅立葉轉換,則運用DFT中有複數對偶之特性,來加速運算 基礎理論: MFCC-三角帶通濾波器與計算對數能量 梅爾頻率數學式: 將FFT後所得的能量頻譜,乘上一組M個的三角帶通濾波器來降低資料維度 將所得M個頻帶能量計算ln,取得對數能量 基礎理論:MFCC-離散餘弦轉換 離散餘弦數學式: 26維的資料由頻率域轉成時域上12維的資料 運算量較IDFT低 基礎理論:MFCC-差量倒頻譜 差量倒頻譜數學式: 運用兩次差量計算出Delta與Acceleration參數,來表示MFCC對於時間的變化 方法改進:觀測語料資訊 方法改進:MFCC-計算能量 計算能量的數學式: 避免資料溢位,我們將上述數學式子改寫為: 方法改進:MFCC-計算能量-TCC300 sv 以e0, e2, …e8, 代入運算,得到TCC300語料發生資料溢位的機率 方法改進:MFCC-計算能量-TIMIT sv 以e0, e2, …e8, 代入運算,得到TIMIT語料發生資料溢位的機率 方法改進:MFCC-計算能量 TCC300計算能量: TIMIT計算能量: TIMIT 語料在錄製時音量較小,考量受測音訊有可能音量較大,因此我們取 為403 方法改進:MFCC-預強調 預強調數學式: 將a放大214倍: 預強調數學式改寫成: 方法改

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档