网站大量收购闲置独家精品文档,联系QQ:2885784924

神经网络与话者识别.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
神经网络建模与话者识别 话者识别 人工神经网络 BP网络 RBF网络 话者识别 话者识别属于生物特征识别技术的一种,是一项根据语音信号中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。话者识别系统主要包括两部分,即特征检测和模式匹配。特征检测的任务是选取唯一表现说话人身份的有效且稳定可靠的特征,模式匹配的任务是对训练和识别时的特征模式做相似性匹配。 话者识别分类 话者识别 话者辨认 话者确认 固定文本系统 自由文本系统 话者辨认 语音 最大选择 辨识结果 (话者ID) 参考模型 (话者#N) 话者确认 模式匹配 welcome to use these PowerPoint templates, New Content design, 10 years experience 目前说话人识别技术主流方法大致有:1)基于模板模型的方法(动态时间归正法DTW和矢量量化法VQ);2)基于概率模型的方法(隐马尔可夫模型法HMM和高斯混合模型法GMM);3)基于人工神经网络(Artificial Neural Network,ANN)的方法;4)基于支持向量机(Support Vector Machine,SVM)的方法;5)融合方法(利用各种方法的优点进行融合)。 人工神经网络 基于ANN的语音识别系统通常由神经元、训练算法及网络结构等三大要素构成。ANN采用了并行处理机制、非线性信息处理机制和信息分布存贮机制等多方面的现代信息技术成果,因此,具有高速的信息处理能力,并且有着较强的适应和自动调节能力,在训练过程中能不断调整自身的参数权值和拓扑结构,以适应环境的和系统性能优化的需求,在模式识别中有着速度快、识别率高等显著特点, 人工神经网络的发展 人工神经网络的研究始于40年代初。半个世纪以来,经历了兴起、高潮与萧条、高潮及稳步发展的远为曲折的道路。 1943年,心理学家W.S.Mcculloch和数理逻辑学家W.Pitts 提出了M—P模型。1949年,心理学家D.O.Hebb提出突触联系可变的假设,根据这一假设提出的学习规律为神经网络的学习算法奠定了基础。 1957 年, 计算机科学家Rosenblatt提出了著名的感知机模型。1960年,B.Windrow和E.Hoff提出了自适应线性单元, 它可用于自适应滤波、预测和模式识别。1968年一本名为《感知机》的著作中指出线性感知机功能是有限的,它不能解决如异或这样的基本问题,而且多层网络还不能找到有效的计算方法。60年代末期,人工神经网络的研究进入了低潮。80年代初期,模拟与数字混合的超大规模集成电路制作技术提高到新的水平,完全付诸实用化,美国的物理学家Hopfield于1982年、1984年在美国科学院院刊上发表了两篇关于人工神经网络研究的论文,引起了巨大的反响。人们重新认识到神经网络的威力以及付诸应用的现实性。 神经网络模型 神经元 神经元是神经网络的基本计算单元,一般是一种多个输入和一个输出的非线性单元,可以有反馈输入和闭值参数 神经网络连接方式 前馈型网络 反馈性网络 神经网络的连接方式 在前馈型网络中,各神经元接受前一层的输入,并输出给下一层,没有反馈。连接点分为两类,即输入单元和计算单元。每一个计算单元可以有任意n个输入但只有一个输出,它可祸合到任意多个其它结点作为输入。通常前馈网络分为不同的层,第l层的输入只与第卜l层的输出相连,输入和输出结点与外界相连,而其它中间层则称之为隐层。根据隐层的层数,还可以再分为单层连接方式、多层连接方式。 神经网络的连接方式 在反馈型网络中,可以看成包含一个单层的神经元,所有神经元结点都是计算单元,同时也可接受输入,并向外界输出。这种网络可以画成一个无向图,其中每条连接线都是双向的。反馈型网络的输出由当前输入和先前的输出,以及网络参数和结构决定,因此显示出短期一记忆的性质。HoPfield网络就是反馈型网络的代表。 典型神经网络模型 1)感知机 2)线性神经网络 3)BP网络 4)径向基函数网络 5)自组织网络 6)反馈网络 BP神经网络 BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。多层BP神经网络模型的拓扑结构如图所示。由图可见,它由输入层、中间层和输出层组成。其中,中间层也叫隐含层,它可以是一层或多层。 。 BP网络标

文档评论(0)

wuyoujun92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档