数学建模声音识别模型的建立与评价.doc

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
声音识别模型的建立与评价 【摘要】 声音识别是研发智能防盗门的重要环节,对正常和非正常开门(指盗窃开门等声音)的声音进行准确地识别变得尤为重要。本文对采集到的正常和非正常声音进行识别模型建立和评价。其主要方法是:利用80次声音数据,结合MATLAB工具及分析计算,建立正常、非正常声音与数据y的均值、方差、短时平均能量均值、短时平均幅度均值、短时平均过零率均值和短时自相关函数均值之间的关系的BP神经网络模型。然后分析模型,确定目标函数t,1表示正常,0表示非正常,即对声音进行识别;又进行误差分析,达到误差要求时将80个数据代入函数,即为对声音模型进行验证与评价。 针对问题一,首先从80次声音数据入手,利用MATLAB的load函数载入到计算机内存,内存中变量有Fs和y等变量,其中Fs为采用频率,y为采用数据。再用sound函数,播放出声音信号,从听觉角度比较正常、非正常声音在响度和音调两方的差异。最后利用plot函数绘制出具体的声音波形图,从视觉角度比较声音的频率与振幅的不同效果。 针对问题二,采用合适的时域分析处理声音信号,找出和提取了最重要的特征向量是短时能量和平均幅度、短时平均过零率、短时自相关函数,并比较了它们在表达声音时的不同优越性和特点,用途。 针对问题三,用MATLAB计算出80个正常、非正常声音数据,y的均值、方差、短时平均能量均值、短时平均幅度均值、短时平均过零率均值和短时自相关函数均值,利用这些均值作为BP神经网络的输入数据p且对p进行转置。确定目标函数t,1表示正常,0表示非正常。进行多次训练达到误差要求,求解和分析模型结果,并对80组样本数据进行检验。最后对BP神经网络模型进行评价、改进及推广。 针对问题四,利用主成分分析(PCA)特征变换对参数进行优化,先在正常和非正常中分别随机选取声音组号,再将以上问题得到的对应特征参数均值进行PCA变换,获得新的特征参数f正和f非能够更具区分性,并用参数优化技术包括语音包络检测、Delta特征的引入,获得更好的声音识别率。 针对问题五,对于原始信号中有叠加一定幅度的白噪声,前期处理时为了达到优良的消噪效果,采用新兴方法小波去噪原理,先用所给函数得到如11.mat的加白噪声的声音,运用MATLAB中的小波工具箱对含噪信号进行小波分解、阈值量化、小波重组,获得的去噪结果与原始信号效果比较,验证小波去噪的可靠性。 关键词:BP神经网络 时域分析 特征向量 主成分分析 小波去噪原理 1 问题重述 A题:声音识别模型的建立与评价 随着家居智能化逐渐普及,智能冰箱、智能清洁机器人、智能电视等已步入平常老百姓家庭,但智能化的防盗门还处于研发阶段,未进入市场。随着人们对家居安全意识的不断增强,对防盗、防抢和防砸的门禁系统的智能性提出更高的要求。基于此,对正常和非正常开门(指盗窃开门等声音)的声音进行识别是智能防盗门的关键问题和技术,其具有广泛的应用前景和实用价值。 为了进行声音识别模型的建立,我们采集到了正常和非正常开门的声音,附件中有正常开门声音(如正1.mat),非正常开门声音(如非1.mat),各40次开门,共80次开门声音数据。该数据可利用matlab的load函数载入到计算机内存,内存中变量有Fs和y等变量,其中Fs为采用频率,y为采用数据。利用这些数据要求完成以下工作: 利用matlab中的sound函数,播放出声音信号,试听并比较正常和非正常开门声音的差别,利用plot函数绘制出具体的声音波形图,总结差别在哪些方面? 利用合适的时域或(和)频域特征表达个声音信号,建立特征向量,写出提取特征向量的具体方法和程序代码。 建立声音识别模型(二分类模型),利用模型区分正常和非正常声音,评价模型的好坏。 试利用特征选择或变换,对特征向量进行优化,并利用参数优化技术优化模型的参数,使识别模型的准确率提高。 若原始声音信号中有环境噪声(如白噪声),设y中叠加了一定幅值的白噪声(利用y1=y+(-0.15+0.3*rand(size(y)))*max(y)叠加噪声),如何对声音进行前期处理? 2 模型假设 假设80组样本的采用数据真实、有效、可靠; 假设每个样本的采用数据之间相互独立; 假设样本音频的录音环境为同一环境且外界环境对数据无影响; 假设我们在网上查阅的资料以及结论真实可靠。 3 符号说明 表示输入层第j个节点的输入,j=1,…,M 表示隐含层第i个节点到输入层第j个节点之间的权值 表示隐含层第i个节点的阈值 表示隐含层的激励函数 表示输出层第k个节点到隐含层第i个节点之间的权值,i=1,…,q 表示输出层第k个节点的阈值,k=1,…,L 表示输出层的激励函数 表示输出层第k个节点的输出

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档