移动机器人原理与技术 课件 第七章 移动机器人语音识别与控制.ppt

移动机器人原理与技术 课件 第七章 移动机器人语音识别与控制.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

7.2.2语音信号的端点检测2.短时过零率值语音命令“前进”的端点检测结果7.2.3语音信号的特征提取特征参数提取的目的是在大量的原始语音数据中提取出能够表征语音信息的特征,筛选出多余的信息并提高语音识别系统的整体性能,梅尔倒谱系数法(MelFrequencyCepstrumCoefficient,简称MFCC)是语音信号特征提取方法中最常用且经典的方法。Mel滤波器模拟了人耳的听觉特性,它与频率的关系可表示为:Mel(f)为语音命令信号的感知频率,f为实际频率。7.2.3语音信号的特征提取感知频率Mel与实际频率f的关系曲线7.2.3语音信号的特征提取MFCC特征参数提取过程7.2.3语音信号的特征提取MFCC算法提取特征参数的步骤如下:1.将采集的语音信号首先做预加重处理,然后进行分帧和加汉明窗。2.快速傅里叶变换(FastFourierTransform,简称FFT):由于时域上语音信号是非平稳的难以反映语音信号的特性,因此需先将其变换到频域上再进行分析,利用FFT变换得到语音信号在频谱上的能量值,其计算公式如下:7.2.3语音信号的特征提取MFCC算法提取特征参数的步骤如下:3.通过Mel滤波器组对语音信号的功率谱进行滤波处理。在一定Mel频率范围内,需要设置一些带通滤波器H(m,k)并且每个滤波器在Mel频率上的宽度都相等,则H(m,k)传递函数的表达式为:7.2.3语音信号的特征提取Mel滤波器组的频率响应曲线7.2.3语音信号的特征提取计算由48个Mel滤波器构成Mel滤波器组的H(m,k),然后再计算语音信号的能量谱,其计算表达式为:4.将从Mel滤波器中得到的语音信号的能量值取对数,然后进行离散余弦变换(DiscreteCosineTransform,简称DCT)即可得出MFCC特征参数值,其表达式为:m表示第m个Mel滤波器,M表示Mel滤波器的总个数,i表示的是DCT变换后的谱线,n表示的是第n帧语音信号7.3声学模型7.3.1混合高斯模型高斯混合模型GMM可以看作是由K个单高斯模型组合而成的模型,这K个子模型是混合模型的隐变量。高斯混合模型GMM就是用高斯概率密度函数精确地量化事物,它是一个将事物分解为若干的基于高斯概率密度函数形成的模型。混合高斯分布的概率密度函数为:7.3.1混合高斯模型混合高斯模型及其相关的参数变量估计是一个不完整数据的参数估计问题。最大似然准则估计方法中的最大期望值算法(ExpectationMaximization,EM)是这一类方法的一个典型代表。EM算法是在给定确定数量的混合分布成分的情况下,去估计各个分布参数的最通用的方法。第一阶段,期望计算阶段(E步骤)以及最大化阶段(M步骤)。7.3.1混合高斯模型EM算法得到的参数估计公式为:从E步骤中计算得到的后验概率如下:7.3.2隐马尔科夫模型马尔可夫链又称离散时间马尔可夫链(discrete-timeMarkovchain),是状态空间中经过从一个状态到另一个状态转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关,这种特定类型的“无记忆性”称作马尔可夫性质。马尔可夫链实际上就是一个随机变量随时间按照Markov性质进行变化的过程。7.3.2隐马尔科夫模型在马尔可夫链的基础上进行扩展,用一个观测的概率分布与马尔可夫链上的每个状态进行对应,这样引入双重随机性,使得马尔可夫链不能被直接观察,因此称为隐马尔可夫模型(HMM),HMM在实现过程中表现出了双重随机性的特点,其中之一是马尔科夫链,它把一段语音信号的输出和每一个状态看成一一对应的过程,是可观测的,另一个用来描述状态和观测值之间的统计对应关系的过程,是不可观测的。将这两个随机过程有机结合起来可较好地处理语音信号之间的动态变化和语音特征的短时平稳问题。7.3.2隐马尔科夫模型隐马尔可夫模型主要由初始概π率、转移概率A、输出概率B三个参数决定。该模型就是利用这三个参数来处理语音特征的短时平稳性。HMM模型拓扑图***************移动机器人技术原理与应用第七章移动机器人语音识别与控制语音信号的特征提取声学模型7.1移动机器人语音识别系统7.27.3移动机器人语音控制7.47.1移动机器人语音识别系统移动机器人的语音识别技术由以下几个过程来实现,包括:语音控制信号的预处理、特征参数的提取、语音控制信号的训练和识别。语音识别系统的整体框图7.1移动机器人语音识别系统语音信号处理

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档