HTK语音识别基础教程.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HTK语音识别基础教程

步骤八:增加高斯混合数 高斯混合模型 1-2, 2-4, 4-8的顺序增加混合数 HHEd -B -H train/hmm16/macros -H train/hmm16/hmmdefs -M train/hmm17 script/mix1.hed train/tiedlist Mix.hed的内容: MU 2 {*.state[2-4].mix} 每增加一次混合数都必须用HERest进行重估 步骤九:测试声学模型 简易语言模型的建立 HVite进行识别 HResults显示识别结果 HLStats -s START END -b bigram -o word.lst word.lbl HBuild -s START END -n bigram word.lst work HVite -C ../common/configcross -H ../train/hmm31/macros -H ../train/hmm31/hmmdefs -S test2.scp -i recout.mlf -w work -p -1.0 -s 5.0 dict ../train/tiedlist HResults -I word.lbl ../train/tiedlist recout2.mlf F(n)= AC(h) + LM(h)*Weight+n*Penalty HTK/语音识别基础教程 目录 语音识别基础 HMM声学模型的训练和基本原理 概要 HMM的3大问题和算法简介 HTK声学模型训练完整步骤 数据的准备 特征量的提取,音素列表,转写文本,发音字典等 HMM的两种初始化方式(HInit,HCompV) Monophone的训练 Triphone的训练(WI,Cross-word) Tied-State Triphone的训练 高斯混合数的增加 语音识别的基础原理 语音识别可以看作是已知观测到语音信号X,求出其语言内容(文字)w,即 最大化的 : 由声学模型得到(声学似然度), 由语言模型决定(先验知识) HMM模型概要 基本概念 HMM与语音信号 状态,状态迁移/输出概率,观测信号序列 3状态音素HMM(非静音):Left-to-right(2-3-4,不允许4-3) without skips(不允许2-4) 参数(各状态迁移概率,信号输出概率:高斯分布) 1 2 5 3 4 O1 O2 O5 O3 O4 O6 HMM构成要素 状态集合: 开始状态 和终了状态 为固定状态,不输出信号 状态迁移概率: 输出概率: 从状态 输出信号o的概率 输出信号系列 观测到的语音信号,如MFCC等特征量 状态系列: 时刻n对应状态 HMM三大基本问题 (具体参考dean/ebooks下的《经典》) 评价问题 (Forward算法) 已知观察序列 和模型参数 ,如何有效的计算 (即模型对数据的拟合程度) 解码问题(Viterbi算法) 已知观察序列 和模型参数 ,在最佳意义上确定一个状态序列 训练问题(EM,Baum-Welch重估) 已知观察序列 和模型参数 ,如何调整模型参数 使 最大 HMM模型评价算法(前项算法) S0 S1 S2 S3 SM 时刻n 状 态 m N 0 N+1 O(1) O(2) O(N) HMM模型评价算法(前项算法) S0 S1 S2 S3 1.0 0.6 0.4 0.2 0.8 a b b (a,b)=(0.7,0.3) (a,b)=(0.6,0.4) 1.0 ×0.7 0.7 ×1.0 0.0 ×0.3 0.126 ×0.4 0.112 ×0.3 0.023 ×0.4 0.029 ×0.4 ×0.4 ×0.6 ×0.6 ×0.2 ×0.2 ×0.8 0.024 两种可能的路径: {S0S1S1S2S3} {S0S1S2S2S3} 两者之和便为信号{abb} 的输出概率: HMM模型评价算法(前项算法) 初期化: 初期迁移: 递进式:对于 , 最终迁移: HMM解码:Viterbi算法 S0 S1 S2 S3 1.0 0.6 0.4 0.2 0.8 a b b (a,b)=(0.7,0.3) (a,b)=(0.6,0.4) 1.0 ×0.7 0

文档评论(0)

pangzilva + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档