- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
音的特徵向量智星多媒索室清大工程系音的辨流程基本流程取音消除音框化音框成特徵向量以特徵向量行辨音的特徵向量旋律辨音高一般音分音高零率音量明亮度音的特徵向量者辨包含一能量值取法音的特徵向量音辨包含一能量值取法人的制及其模型音的基本特音量音波的震幅大小音高音波的基本率高低容或音色每一波形在一期的化
語音訊號的特徵向量 張智星 jang@.tw .tw/~jang 多媒體資訊檢索實驗室 清華大學 資訊工程系 語音訊號的辨識流程 基本流程 擷取語音訊號 消除雜訊 音框化 音框轉成特徵向量 以特徵向量進行辨識 語音訊號的特徵向量 旋律辨識 音高(Pitch) 一般音訊分類 音高 過零率 音量 明亮度 語音訊號的特徵向量 語者辨識 MFCC(Mel-frequency cepstral coefficients,包含一階導數,對數能量值) Normalized MFCC (採取 Cepstrum Mean Subtraction 法) Real cepstrum LPC (Linear Predictive Coding)係數 Real cepstrum參數 LSP (Line Spectrum Pair)參數 PARCOR參數 語音訊號的特徵向量 語音辨識 MFCC(Mel-frequency cepstral coefficients,包含一階導數,對數能量值) Normalized MFCC (採取 Cepstrum Mean Subtraction 法) 人聲的發聲機制及其數學模型 Source-filter model: Speech is split into a rapidly varying excitation signal and a slowly varying filter. The envelope of the power spectra contains the vocal tract info. Two important characteristics of the model are fundamental (pitch) frequency (f0) and formants (F1, F2, F3, …) 聲音的基本特質 音量:音波的震幅大小 音高:音波的基本頻率高低 內容或音色:每一個波形在一個週期的變化 Pitch and Formants Real-time Spectrogram Physical Meanings of Cepstrum -*- * Pitch and formants can be defined visually: Second formant F2 First formant F1 Pitch period = 1/f0 Try “dspstfft_nt”: Spectrogram: Spectrum: * *
您可能关注的文档
最近下载
- 肾盂旁囊肿的研究的现状及进展.doc VIP
- 3.1《中国科学技术史序言(节选)》课件-中职高二语文(高教版2024拓展模块上册).pptx
- PCB多层压合工艺PPT课件.ppt
- 第一单元第二节+体验“云上生活”++课件 2024—2025学年川教版(2024)信息科技+七年级上册.pptx VIP
- Garmin佳明Forerunner 165 智能GPS跑步腕表说明书用户手册.pdf
- 工程项目工期关键节点和线路保证措施(模板)18.docx VIP
- 泰康入职测评考试题库答案.pdf
- Ai围棋定式大全(重排彩图).pdf
- 汽车钣喷系列教学课件--钣金件焊接工艺.ppt
- 人力资源有限公司管理制度.docx VIP
文档评论(0)