- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
9.3 孤立词语音识别系统 由于在孤立字(词)识别中,单词之间有停顿,可使识别问题简化;单词之间的端点检测比较容易;单词之间的协同发音影响较小;一般对孤立单词的发音都比较认真等。所以这种系统存在的问题较少,较容易实现。由于此系统本身用途甚广,且其许多技术对其他类型系统有通用性并易于推广,所以稍加补充一些知识即可用于其他类型系统(如在识别部分加用适当语法信息等,则可用于连续语音识别中)。 训练 孤立词语音识别系统框图 特征提取 模板(模型) 语音 结果 模式匹配 拒识 匹配结果 基于DTW的模式匹配;基于VQ的模式匹配;基于HMM的模式匹配;基于SVM 的模式匹配;基于混合技术的模式匹配 识别 9.4 连续语音识别系统 在连续语音识别系统中,一段语音信号(例如一个句子)经特征提取后,得到一个特征矢量的时间序列 ,假设该特征矢量序列可能包含的一个词序列为 ,那么连续语音识别的任务就是找到对应观测矢量序列 的最可能的词序列 。这个过程如果按照贝叶斯准则就是: 在连续语音识别系统中利用语言模型的目的是找出符合句法约束的最佳单词序列,并且减少观测矢量序列 和词序列 的匹配有哪些信誉好的足球投注网站范围,提高识别效率。 声学处理 语音解码 词表匹配 语音模型 词表 语言模型 语言解码 语音信号 音节阵列 连续语音识别原理图 声学特征 词阵列 声学模型 HMM连续语音识别一般过程 1. 前向后向算法计算P(O|λ) ; 2. Baum-Welch 算法求出最优解 λ*= argmax {P(O|λ)}; 3. Viterbi算法解出最佳状态转移序列; 4. 根据最佳状态序列对应的λ给出候选音节或声韵母 5. 通过语言模型形成词和句子 Baum-Welch Re-estimation Speech database Feature Extraction Converged? l1 l2 lN HMM waveform feature Yes No end HMM语音识别训练过程 MAX Recognized word Speech 特征提取 似然概率计算 l1 似然概率计算 lV . . . P(X|l1) P(X|lV) HMM 1 HMM V HMM语音识别过程 . . . 汉语语音建模基元比较 HMM用于SR的参数设置 状态数目 Rabiner等人1983年的实验表明,状态数目超过5个对识别率没有改善 很多的实验也认为具有5~6个状态的HMM对孤立词的识别已足够了 而对音素或声韵母的HMM模型,一般2~3个状态就比较合适了 适用于语音识别的HMM模型结构 “从左到右”的HMM模型 普通的HMM被认为是全状态转移的,但在应用中可以对状态转移加以适当的限制 通常把状态转移矩阵A限制为上三角的,这样状态转移只发生在Si到Sj之间(i?j),这样的HMM称为“从左到右”的HMM 这种模型的拓扑结构包含了时间信息,因为前面状态的输出观察值必定在后面状态的输出观察值之前,从而适应了语音的时序性 对于“从左到右”模型,其初始状态始终在第一个状态,并且认为多套训练样本是相互独立的,因此稍微修改可以得到其训练算法。 作业 1. 编程实现基于DTW的10个数字0~9的识别 2. 编程实现基于HMM的10个数字0~9的识别 9.1 语音识别概述 9.2 动态时间规整DTW 9.3 孤立词语音识别 9.4 连续语音识别 9.1 语音识别概述 一、语音识别的定义 二、语音识别的应用 三、语音识别的类型 四、语音识别的方法 五、语音识别的主要问题 一、语音识别的定义 语音识别是指从语音到文本的转换,即让计算机能够把人发出的有意义的话音变成书面语言。通俗地说就是让机器能够听懂人说的话。 所谓听懂,有两层意思,一是指把用户所说的话逐词逐句转换成文本;二是指正确理解语音中所包含的要求,作出正确的应答。 二、语音识别的应用 语音识别技术是以语音为研究对象,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域。 随着语音识别技术的逐渐成熟,语音识别技术开始得到广泛的应用,涉及日常生活的各个方面如电信、金融、新闻、公共事业等各个行业,通过采用语音识别技术,可以极大的简化这些领域的业务流程以及操作;提高系统的应用效率。 1.语音识别以IBM推出的ViaVoice为代表,国内则推出Dutty ++语音识别系统、天信语音识别系统、世音通语音识别系统等。 2. 数据库检索:对庞大的数据进行繁杂的检索和查询,通过使用语音识别技术,将变得轻松、方便。 3.
您可能关注的文档
最近下载
- 中国农村的市场和社会结构.ppt VIP
- 超市供货方案.docx VIP
- GB_T 43652-2024城市和社区可持续发展 韧性城市指标.docx VIP
- 2022年12月贵州省第三人民医院第二次公开招聘工作人员18日至20日(一)笔试参考题库含答案解析.docx
- 小学英语_【课堂实录】 Is there a gym around教学设计学情分析教材分析课后反思.doc
- 2024(部编版)历史七年级上册第三单元 大单元教学课件.pptx
- 解读《中华人民共和国学前教育法》 (1).pptx VIP
- 2024年10月中国出口信用保险公司浙江分公司营业部招考1名人员笔试历年参考题库附带答案详解.docx
- 中华人民共和国学前教育法解读.pptx VIP
- 2024年04月中国出口信用保险公司浙江分公司2024年春季招考笔试历年参考题库附带答案详解.docx
文档评论(0)