第十讲语音信号处理精要.ppt

下载文档 降价啦

1
0
约4.64千字
约 41页
2016-05-27 发布于湖北
举报
版权申诉
保障服务

第十讲语音信号处理精要.ppt

1、本文档共41页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

9.3 孤立词语音识别系统由于在孤立字（词）识别中，单词之间有停顿，可使识别问题简化；单词之间的端点检测比较容易；单词之间的协同发音影响较小；一般对孤立单词的发音都比较认真等。所以这种系统存在的问题较少，较容易实现。由于此系统本身用途甚广，且其许多技术对其他类型系统有通用性并易于推广，所以稍加补充一些知识即可用于其他类型系统（如在识别部分加用适当语法信息等，则可用于连续语音识别中）。训练孤立词语音识别系统框图特征提取模板（模型）语音结果模式匹配拒识匹配结果基于DTW的模式匹配；基于VQ的模式匹配；基于HMM的模式匹配；基于SVM 的模式匹配；基于混合技术的模式匹配识别 9.4 连续语音识别系统在连续语音识别系统中，一段语音信号（例如一个句子）经特征提取后，得到一个特征矢量的时间序列，假设该特征矢量序列可能包含的一个词序列为，那么连续语音识别的任务就是找到对应观测矢量序列的最可能的词序列。这个过程如果按照贝叶斯准则就是：在连续语音识别系统中利用语言模型的目的是找出符合句法约束的最佳单词序列，并且减少观测矢量序列和词序列的匹配有哪些信誉好的足球投注网站范围，提高识别效率。声学处理语音解码词表匹配语音模型词表语言模型语言解码语音信号音节阵列连续语音识别原理图声学特征词阵列声学模型 HMM连续语音识别一般过程 1. 前向后向算法计算P(O|λ) ； 2. Baum-Welch 算法求出最优解 λ*= argmax {P(O|λ)}； 3. Viterbi算法解出最佳状态转移序列； 4. 根据最佳状态序列对应的λ给出候选音节或声韵母 5. 通过语言模型形成词和句子 Baum-Welch Re-estimation Speech database Feature Extraction Converged? l1 l2 lN HMM waveform feature Yes No end HMM语音识别训练过程 MAX Recognized word Speech 特征提取似然概率计算 l1 似然概率计算 lV . . . P(X|l1) P(X|lV) HMM 1 HMM V HMM语音识别过程 . . . 汉语语音建模基元比较 HMM用于SR的参数设置状态数目 Rabiner等人1983年的实验表明，状态数目超过5个对识别率没有改善很多的实验也认为具有5～6个状态的HMM对孤立词的识别已足够了而对音素或声韵母的HMM模型，一般2～3个状态就比较合适了适用于语音识别的HMM模型结构 “从左到右”的HMM模型普通的HMM被认为是全状态转移的，但在应用中可以对状态转移加以适当的限制通常把状态转移矩阵A限制为上三角的，这样状态转移只发生在Si到Sj之间(i?j)，这样的HMM称为“从左到右”的HMM 这种模型的拓扑结构包含了时间信息，因为前面状态的输出观察值必定在后面状态的输出观察值之前，从而适应了语音的时序性对于“从左到右”模型，其初始状态始终在第一个状态，并且认为多套训练样本是相互独立的，因此稍微修改可以得到其训练算法。作业 1. 编程实现基于DTW的10个数字0~9的识别 2. 编程实现基于HMM的10个数字0~9的识别 9.1 语音识别概述 9.2 动态时间规整DTW 9.3 孤立词语音识别 9.4 连续语音识别 9.1 语音识别概述一、语音识别的定义二、语音识别的应用三、语音识别的类型四、语音识别的方法五、语音识别的主要问题一、语音识别的定义语音识别是指从语音到文本的转换，即让计算机能够把人发出的有意义的话音变成书面语言。通俗地说就是让机器能够听懂人说的话。所谓听懂，有两层意思，一是指把用户所说的话逐词逐句转换成文本；二是指正确理解语音中所包含的要求，作出正确的应答。二、语音识别的应用语音识别技术是以语音为研究对象，涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域。随着语音识别技术的逐渐成熟，语音识别技术开始得到广泛的应用，涉及日常生活的各个方面如电信、金融、新闻、公共事业等各个行业，通过采用语音识别技术，可以极大的简化这些领域的业务流程以及操作；提高系统的应用效率。 1.语音识别以IBM推出的ViaVoice为代表，国内则推出Dutty ++语音识别系统、天信语音识别系统、世音通语音识别系统等。 2. 数据库检索：对庞大的数据进行繁杂的检索和查询，通过使用语音识别技术，将变得轻松、方便。 3.