声音识别模型的建立与评价.pdf

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2016长沙理工大学第二届研究生数学建模竞赛参赛 承诺书 我们仔细阅读了长沙理工大学研究生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式 (包括电 话、电子邮件、网上咨询等)与队外的任何人 (包括指导教师)研究、 讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的 成果或其他公开的资料 (包括网上查到的资料),必须按照规定的参 考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。 如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权长沙理工大学研究生数学建模竞赛组委会,可将我们的 论文以任何形式进行公开展示 (包括进行网上公示,在书籍、期刊和 其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从组委会提供的试题中选择一项填写): 我们的参赛报名号为(如果组委会设置报名号的话): 所属学校(请填写完整的全名): 长沙理工大学 参赛队员 (打印并签名) :1. 刘星 (电气) 2. 邹勇松(计通) 3. 赵磊(计通) 指导教师或指导教师组负责人 (打印并签名):戴志峰 日期:2016 年 3月 8 日 评阅编号(由组委会评阅前进行编号): 2016长沙理工大学研究生数学建模竞赛 编 号 专 用 页 评阅编号(由组委会评阅前进行编号): 评阅记录(可供评阅时使用): 评 阅 人 评 分 备 注 B题 声音识别模型的建立与评价 摘 要 本文选取合适声音特征参数设计一个声音识别模型,并给出了具体的建立方 案,然后还要对建立的模型进行优化提高识别准确度。 对于问题一,首先对声音信号进行了试听,然后利用Matlab绘制了声音波形 如图一、图二所示,通过两类声音进行比较和分析。得出两类声音如下区别:非 正开门声的幅值明显比正常高,说明非正常开门声响声大,而且非正常声音持续 的时间远比正常的要长。 对于问题二,首先对声音信号的短时平均能量和短时过零率这两个时域特征 Mel MFCC 进行分析如图三和图四所示。然后对 倒谱系数 ( )这一频域特征进行 Mel MFCC 了分析如图八所示,并且通过 倒谱系数 ( )建立了一个13维的特征 向量如附件一所示。 Mel 对于问题三,利用上一问中提取的 倒谱系数这一重要特征,经过训练后, MFCC GMM 建立了基于 和 声音识别模型如图九所示,然后随机选取一段声音信 号进行测试,测试结果如图十一所示,从图中可以看出此模型能够区分正常与非 正常声音。 对于问题四,我们利用主成分分析法建立了特征向量优化模型如式33所示, 得出声音的两个主要特征是短时平均能量和MFCC,然后在上面的声音识别模 型中加入了短时平均能量这一时域特征向量,最后对优化后的声音识别模型进行 检验,发现优化后的模型识别准确率有了进一步的提高。 对于问题五,首先按照题目的要求,利用Matlab 中的随机函数rand产生一 个噪声加入到声音信号中,得到了加噪后的声音时域和频域的波形图如图十三和 图十四所示。然后设计了基于双线性变换法的Butterworth滤波器模型,通过此 滤波器模型对加噪后的声音进行滤波,得到的时域和频域波形图如图十五和图十 六所示。比较滤波前后可以看出噪声基本能被过滤掉,设计的Butterwo

文档评论(0)

三哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档