- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于深度学习神经网络的孤立词语音识别
基于深度学习神经网络的孤立词语音识别的研究*(
王山海,景新幸,杨海燕+
(桂林电子科技大学 信息与通信学院,广西 桂林 541004)
摘要:为了提高语音识别系统性能,研究提出将自编码器深度学习神经网络应用于语音识别中。该网络结构引入贪婪逐层预训练学习算法,通过预训练和微调两个步骤,提取出待识别语音信号的本质特征,克服传统多层人工神经网络模型在训练时存在易陷入局部极小值且需要大量标签数据的问题。然后经过规整网络,将任意长度帧的语音特征参数规整到某一特定帧,输入到分类器中进行语音识别。对反向传播神经网络和自编码神经网络分别进行了仿真实验,结果表明深度学习神经网络识别准确度较传统神经网络提升了26.1%,是一种优良的语音识别模型。
关键字:语音识别;人工神经网络;深度学习;自编码器;规整网络
中图分类号:TN912
Study of isolated speech recognition based on deep learning neural networks
WANG Shan-hai, JING Xin-xing, YANG Hai-yan
(School of Information and Communication, Guilin University of Electronic Technology, Guilin Guangxi 541004, China)
Abstract: To improve the?performance of the conventional?speech recognition system, the research introduced the autoencoder deep learning neural networks which was applied to speech recognition. The neural networks based on deep learning introduced greedy layer-wise learning algorithm by pretraining and fine-tuning. It could extract the essential features of speech signal which was needed to recognition. It could overcome?the shortcomings of the conventional multilayer artificial neural networks which easily trapped into local optimum when training the model. And they need a large number of labeled data. Then the structured alignment networks could align arbitrary frames of features to fixed frames. And these features were input to a classifier to speech recognition. This paper did some experiment with back propagation neural networks and autoencoder neural networks respectively. The results illustrate that the deep learning neural networks can outperform the conventional neural networks by 26.1% in accuracy. It is an excellent speech recognition model.
Key Words: speech recognition; artificial neural networks; deep learning; autoencoder; alignment networks
引言
语音识别是为了让计算机理解人类语言的命令,达到人机交互智能化的目的。随着计算机技术的不断发展和广泛应用,语音识别技术得到了迅速发展,语音识别的研究越来越受到人们的关注。
目前常用的识别方法主要有:动态时间规整(Dynamic Time Warping, DTW)方法、 矢量量化(Vector Quantization, VQ)方法和隐马尔科夫模型(Hidden Markov Model, H
您可能关注的文档
- 基于分数低阶统计量的时延估计算法性能分析-四川理工学院学报.PDF
- 基于前向空间线性预测的声源时延估计算法-计算机工程.PDF
- 基于单片机的激光图案投射仪中的接口电路.PDF
- 基于Ιντερνετ的机器人控制中网络时延测试及分析Ξ-中国科学院沈阳.PDF
- 基于三分量分解优化模型的农用地SAR 影像提取方法 - Ingenta Connect.PDF
- 基于单片机和CAN 总线的信号测量和数据传输 - 应用科技 - 哈尔滨.PDF
- 基于双边滤波的HDR图像色调5射算法 - 云南大学学报.PDF
- 基于可调谐半导体激光吸收光谱技术的气体浓度测量温度-物理学报.PDF
- 基于双探测器的手持式激光测距仪系统设计与实现-中南大学学报.PDF
- 基于回弹控制的高强度薄板拉深成形参数优化设计-计算机集成制造系统.PDF
- 北师大版小学数学三年级上册《寄书》教学设计.docx
- 统编版(部编版)语文二年级上册《雪孩子》教学设计.docx
- 统编版(部编版)语文二年级上册《八角楼上》教学设计.docx
- 北师大版小学数学三年级上册《长方形周长》教学设计.docx
- 北师大版小学数学三年级上册《丰收了》教学设计.docx
- 统编版(部编版)语文二年级上册《夜宿山寺》教学设计.docx
- 统编版(部编版)语文二年级上册《风娃娃》教学设计.docx
- 统编版(部编版)语文二年级上册《朱德的扁担》教学设计.docx
- 统编版(部编版)语文二年级上册《难忘的泼水节》教学设计.docx
- 统编版(部编版)语文二年级上册《纸船和风筝》教学设计.docx
文档评论(0)