- 1、本文档共46页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HMM在语音识别中的应用.ppt
在语音识别中的应用 报告人:林常志 语音识别技术基础与应用 模式识别系统的基本构成 语音识别系统的基本构成 语音识别的几个关键因素 常用模式匹配方法 马尔可夫链理论 一阶离散马尔可夫模型 一阶离散马尔可夫模型 一阶离散马尔可夫模型 一阶离散马尔可夫模型 一阶离散马尔可夫模型 一阶离散马尔可夫链 隐马尔可夫链(HMM)理论 隐马尔可夫链—三个硬币隐马尔可夫模型 隐马尔可夫链—三个硬币隐马尔可夫模型 隐马尔可夫模型的参数 隐马尔可夫模型的三个基本问题 如何解决三个基本问题 经典HMM语音识别一般过程 经典HMM语音识别训练过程 经典HMM语音识别识别过程 HMM语音识别系统的实现 语音信号预处理与特征提取 语音信号预处理与特征提取 语音信号预处理与特征提取 语音信号预处理与特征提取 语音信号预处理与特征提取 声学模型与模式匹配 声学模型与模式匹配 声学模型与模式匹配 语言模型与语言处理 Baum-Welch Re-estimation Speech database Feature Extraction Converged? l1 l2 l7 HMM waveform feature Yes No end Select maximum Recognized word Speech Feature extraction Likelihood computation l1 Likelihood computation lV . . . P(X|l1) P(X|lV) HMM 1 HMM V 语音信号预处理与特征提取 声学模型与模式匹配 语言模型与语言处理 振动 在空气中形成压力波动 传感器的动作 时变的电压信号 特征选取: 1) 幅度(或功率) 2) 过零率 3) LPC 预测系数特征矢量 4) LPC 倒谱特征矢量(LPCC) 5) Mel 倒谱参数(MFCC) 6) 前三个共振峰F1、F2、F3 以梅尔刻度式倒频谱参数(MFCC)为例: 语音信号 预加重 分帧 加窗 快速傅立叶变换 三角带通滤波器 逆傅立叶变换 特征参数 计算短时能量 模型基元 声韵母:声母22个,韵母38个 音节 :412个音节 ,1282个有调音节 词 模型的结构选取 各态历经 从左至右 参数初始化: 起始状态概率(π) 状态转移概率(A) 观测序列概率(B) 根据观测序列概率表示方法的不同: 离散的HMM(DHMM) 连续的HMM(CHMM) 半连续的HMM(SCHMM) DHMM: 离散的符号作为观测量 bj(x) bj(k) bj(x) CHMM: 观测量为连续概率密度函数 每个状态有不同的一组概率密度函数 SCHMM: 观测量为连续概率密度函数 所有状态共享一组概率密度函数 采用统计语法的语言模型 基本原理:采用大量的文本资料,统计各个词的出现概率及相互关联的条件概率,并将这些知识与声学模型结合进行结果判决,减小误识。 设W=w1,w2,…,wQ,其概率表示为: P(W)=P(w1,w2,…,wQ) =P(w1)P(w2|w1)……P(WQ|W1,W2,…WQ-1) Unigram Bigram Trigram an what thin ? has a what think ? had watch thin ? a when see ? are 组合 t(frame) 1 30 40 100 140 注:只有一个候选 * * HMM 语音识别 声学 信息论 语音语言学 信号 处理 人工 智能 模式 识别 数理 统计 听写机 查询 系统 电话 拨号 残疾人用品 消费 电子 … … 实际应用 学科基础 信息获取 预处理 特征提取 分类器设计 分类决策 训练过程 analysis Pattern training Templates or models Pattern classifier Decision logic speech Recognized speech LPCC MFCC Test pattern Reference pattern Search algorithm 语者无关/相关 词表大小 孤立词 vs. 连续语音 环境噪声等 1. Dynamic Time Warping (DTW) 2. Hidden Markov Modelling (HMM) 3.
您可能关注的文档
- GB5021995水喷雾灭火系统设计规范www.shxf.net.pdf
- GB6995.42008T电线电缆识别标志方法第4部分电气装备电线电缆绝缘线芯识别标志.pdf
- GB72622009T公路通信技术要求及设备配置.pdf
- geostudio之部分淹没边坡稳定性分析(Slope).ppt
- GISGPS在车辆监控系统中的应用和研究.ppt
- GIS技术在船舶大气污染物排放清单建立研究中的应用.pdf
- GPS动态测量精度检测及分析.pdf
- gps定位技术在工程控制网中的应用.doc
- GPS干扰信号建模与仿真.pdf
- H1N1亚型猪流感病毒广东分离株全基因克隆及其遗传演化分析.pdf
- 北师大版小学数学三年级上册《寄书》教学设计.docx
- 统编版(部编版)语文二年级上册《雪孩子》教学设计.docx
- 统编版(部编版)语文二年级上册《八角楼上》教学设计.docx
- 北师大版小学数学三年级上册《长方形周长》教学设计.docx
- 北师大版小学数学三年级上册《丰收了》教学设计.docx
- 统编版(部编版)语文二年级上册《夜宿山寺》教学设计.docx
- 统编版(部编版)语文二年级上册《风娃娃》教学设计.docx
- 统编版(部编版)语文二年级上册《朱德的扁担》教学设计.docx
- 统编版(部编版)语文二年级上册《难忘的泼水节》教学设计.docx
- 统编版(部编版)语文二年级上册《纸船和风筝》教学设计.docx
文档评论(0)