- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目 录
一.设计任务书 0
1.语音识别概述 0
2.语音识别分类 1
3.语音识别模型算法 1
⑴声学建模 1
⑵语言模型 1
4.利用dsp进行语音识别 1
二、设计内容 2
1.设计要求及目标,基本部分: 2
2.设计思路 2
三、设计方案、算法原理说明 2
1.设计方案的原理框图: 2
2.算法说明 1
⑴端点检测算法 1
⑵特征矢量提取的算法 2
⑶动态时间规整(dtw)算法 2
四、程序设计、调试与结果分析 3
1.程序功能介绍: 3
2.对语音信号的时域及特征矢量的分析 3
3.运行结果测试: 6
五、设计(安装)与调试的体会 7
(1).刘轶龙: 7
(2).布和: 7
六、参考文献 7
一.设计任务书
1.语音识别概述
语音识别(Speech Recognition)是指让机器听懂人说的话,即在各种情况下,准确的识别语音的内容,从而根据其信息,执行人的各种意图或执行特定的任务,其最终目标是实现人与机器进行自然语言通信。
2.语音识别分类
按照识别的对象不同,语音识别任务大体可分为3类即孤立词识别(isolated word recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别的任务是识别事先已知的孤立的词;连续语音识别的任务则是识别任意的连续语音;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现。针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。声学建模(HMM)算法:马尔可夫模型的概念是一个离散时域有限状态自动机,隐马尔可夫模型HMM是指这一马尔可夫模型的内部状态外界不可见,外界只能看到各个时刻的输出值。(DTW)算法:它是吧时间归整和间距测量计算结合起来的一种非线性归整技术,与隐式马尔可夫模型(HMM)算法相比,它不是一种有效的利用统计方法进行训练的算法,同时,也不容易将底层和顶层的各种知识用到识别算法中,在解决大词汇量、连续语音、非特定发音人语音识别系统时,识别效果较差,但在孤立词语音识别系统中识别效果良好,并且,由于DTW算法计算量较少。因此,DTW 算法在孤立词语音识别系统中得到了较为广泛的应用。
⑵语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。(DTW)算法来进行语音识别。
4.利用dsp进行语音识别
利用DSP可以对语音信号进行实时采集、提取语音特征向量、进行语音识别。语音识别系统对语音特征参量的提取可以采用FFT等算法,不同的参数表示不同的频谱包络。将DTW算法移植到TMS320VC5402上实现语音识别,能满足实时性要求。
二、设计内容
1.设计要求及目标,基本部分:
⑴对DMA进行初始化;
⑵对A/D、D/A进行初始化;
⑶编写DMA中断服务程序,实现语音信号的实时识别;
⑷根据识别系统的类型选择一种识别方法,采用语音分析方法分析出这种识别方法所要求的语音特征参数,作为标准模式由机器存储起来,形成标准模式库。
⑸对语音进行特征参数的分析,语音信号经过相同的通道得到语音参数,生成测试模板;
⑹将测试模板与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果,从而实现语音的识别。
2.设计思路
首先利用DSP对语音信号进行分析,提取语音的特征参数(临界带谱),形成“模板”。语音识别系统对特征参量的提取采用FFT算法。识别时,对其进行特征参数的分析,识别参数可以选择平均能量、过零数或平均过零数、频谱。最后将语音参数和模板进行比较,从而实现语音的识别。
三、设计方案、算法原理说明
1.设计方案的原理框图:
2.算法说明
⑴端点检测算法
语音端点检测就是检测语音信号的起点和终点,也叫起止点识别。在端点检测的过程中,对短时语音信号特征参数分析起到了重要的作用,其中在此次实验算法中,我们主要用到了过零率和短时平均幅度两个短时特征参数。
过零率Z定义为:在统计的短时间段中,信号穿过零电平的次数。即:
Z=
短时平均幅度M定义为:在统计的短时间段中,信号的幅度之和。
Z=
首先规定高能阈值为该段语音信号平均幅度的二分之一,低能阈值为该段语音信号平均幅度的四分之一。检测语音信号起始位置的方法是:根据M是否高于Mh来判断该帧信号数据中是否包含语音信号;检测语音信号终止位置的方法是:即判断该帧信号数据的M是否低于Ml,若低于,则语音信号已终止,否则,反之。
其流程图为:
⑵特征矢量提取的算法
首先,我们选用的特征矢量为临界带特征矢量,而提取此特征矢量的方法为:
第一步,求出每一帧的加窗语音Xn(m):m=O~(N一1
文档评论(0)