语音讯号的特征向量.ppt

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
音的特徵向量智星多媒索室清大工程系音的辨流程基本流程取音消除音框化音框成特徵向量以特徵向量行辨音的特徵向量旋律辨音高一般音分音高零率音量明亮度音的特徵向量者辨包含一能量值取法音的特徵向量音辨包含一能量值取法人的制及其模型音的基本特音量音波的震幅大小音高音波的基本率高低容或音色每一波形在一期的化

語音訊號的特徵向量 張智星 jang@.tw .tw/~jang 多媒體資訊檢索實驗室 清華大學 資訊工程系 語音訊號的辨識流程 基本流程 擷取語音訊號 消除雜訊 音框化 音框轉成特徵向量 以特徵向量進行辨識 語音訊號的特徵向量 旋律辨識 音高(Pitch) 一般音訊分類 音高 過零率 音量 明亮度 語音訊號的特徵向量 語者辨識 MFCC(Mel-frequency cepstral coefficients,包含一階導數,對數能量值) Normalized MFCC (採取 Cepstrum Mean Subtraction 法) Real cepstrum LPC (Linear Predictive Coding)係數 Real cepstrum參數 LSP (Line Spectrum Pair)參數 PARCOR參數 語音訊號的特徵向量 語音辨識 MFCC(Mel-frequency cepstral coefficients,包含一階導數,對數能量值) Normalized MFCC (採取 Cepstrum Mean Subtraction 法) 人聲的發聲機制及其數學模型 Source-filter model: Speech is split into a rapidly varying excitation signal and a slowly varying filter. The envelope of the power spectra contains the vocal tract info. Two important characteristics of the model are fundamental (pitch) frequency (f0) and formants (F1, F2, F3, …) 聲音的基本特質 音量:音波的震幅大小 音高:音波的基本頻率高低 內容或音色:每一個波形在一個週期的變化 Pitch and Formants Real-time Spectrogram Physical Meanings of Cepstrum -*- * Pitch and formants can be defined visually: Second formant F2 First formant F1 Pitch period = 1/f0 Try “dspstfft_nt”: Spectrogram: Spectrum: * *

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档