网站大量收购闲置独家精品文档,联系QQ:2885784924

嵌入式语音门禁系统的设计与实现.pptx

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
嵌入式语音门禁系统的设计与实现

嵌入式语音门禁系统的设计与实现总体介绍以语音识别原理为基础,设计了一个基于ARM9微控制器的语音识别门禁系统。系统采用了$3C2440微处理器,UDAl341专用语音芯片和触摸屏等硬件设计。并基于 Linux3操作系统和QT/Embedded形用户界面(GUI)编程,实现对特定说话人的语音识别。 结果表明,该门禁系统界面友好,操作简单,且具有良好的识别效果。 目录页目01录Contents语音识别基本原理02门禁系统的设计与实现03实验数据与结果PART ONE 1语音识别基本原理1、端点检测2、特征提取3、基于DTW的模式匹配算法语音识别基本原理语音识别系统本质上是一种多维模式识别系统,其主要包括端点检测、特征提取、语音建模、模式匹配四个基本单元|。其识别过程如图1所示。 端点检测准确检测出每个词或句子的起点和终点短时平均能量短时平均过门限率(过零率)特征提取对端点检测后的语音数据,采用Mel倒谱参数进行参数提取。Mel频率倒谱系数(MFCC)是语音信号的频域参数,它是一种基于人耳对语音频率的非线形感知特征的描述;在说话人识别中,有较好的识别性能和抗噪能力。基于DTW的模式匹配算法动态时间归整(DTW)算法是把时问归整和间距测量计算结合起来的一种非线性归整技术,它有效地解决了小词汇量识别中说话速度不均匀的问题。该算法原理是寻找一条通过各个交叉点的从起始点到终止 点的帧失真度总和为最小的最佳路径。当词汇量较少时,用DTW算法对特定人的语音识别可以获得很好的效果。PART TWO 2门禁系统的设计和实现 1、基本结构总体设计2、硬件电路设计 3、软件部分设计总体设计硬件电路设计 本系统硬件电路主要由$3C2440处理芯片、 UDAl341TS音频芯片和3.5寸触摸屏为核心,配合Flash存储芯片、SDRAM内存芯片、电源电路等共同实现系统的架构。硬件电路设计 电路连接时,$3C2440的IIS总线信号(包括时钟和数据)分别与UDAl341的IIS信号相连,L3接口的引 脚L3MODE、L3CLOCK和L3DATA分别与$3C2440的3个 I/O口GPB2,GPB3,GPB4相连,VINLl/R1为音频信号左右声道输入接口。电路图如图4所示。软件部分设计Linux音频程序设计语音识别算法程序设计QT图形界面设计系统移植 语音识别算法程序设计语音识别算法程序包括:端点检测函数endpoint ()、特征参数提取函数mfcc()、距离匹配运算函数dtw()、数据建模model()函数等。DTW算法基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题。图形界面(3)QT图形界面设计系统移植系统的移植包括Linux内核系统的裁剪,文件系统的建立,最后到镜像文件的烧写。本系统的内核版本为Linux2.6.13,可以通过makemenuconfig命令进行简单裁剪,最重要的是把 UDAl341驱动程序和LCD触摸屏驱动程序编译进内核。接下来是制作文件系统,本系统采用yaffs2文件系统: 先用至llbusybox编译出文件系统所需要的应用程序,然后建立必要的文件夹,更重要的是把QT/Embedded需要 的库文件和二进制程序文件一起编译进去,最后通过 uboot烧写进ARM9芯片并调试通过。PART THREE 2门禁系统的设实验数据分析与结论计和实现门禁系统的设实验数据分析与结论计和实现在实验室先对一名男生和一名女生进行语音训练 建模,训练的样本为每人2组词汇(“开门”和“芝麻开门”),每个词汇录音时间为3秒,训练8次。建立模板后,开始识别实验。实验一:该男生和女生分别进行喊话,每个人每 组词喊话20次,实验结果如表l所示。门禁系统的设实验数据分析与结论计和实现实验二:组织非模版库其他10+人,利用相同的 喊话文本对系统进行识别测试,每人每组词喊话1次,实验结果如表2所示。实验结论:通过两组实验数据,可以得出系统有良好的识别效果。谢谢大家THANK YOU FOR YOUR ATTENTIONm为训练语音帧的时序标号,m=1为起点语音帧,m=M为终点语音帧,因此M为该模板所包含的语音帧总数,R(m)为第m帧的语音特征矢量。n为测试语音帧的时序标号,n=1为起点语音帧,n=N为终点语音帧,因此N为该模板所包含的语音帧总数,T(n)为第n帧的语音特征矢量。参考模板与测试模板一般采用相同类型的特征矢量(如MFCC,LPC系数)、相同的帧长、相同的窗函数和相同的帧移。??。 假设测试和参考模板分别用T和R表示已存入模板库的各个词条称为参考模板,一个参考模板可表示为R={R(1),R(2),……,R(m),……,R(M)} 所要识别的一个输入词条语音称为测试模板,可表示为T={T(1),T(2),……,T(n),……,T(N)}为了比

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档