- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于深度学习的手写汉字识别技术研究
--第1章绪论
1.1课题研究的目的及意义
20世纪中期,第一台计算机在美国诞生,人类的信息时代拉开了序
幕,随后信息革命悄无声息的开始了,到目前为止,计算机已经由
原来的仅供军事领域到人们的日常生活中,功能更是不可同日而语
了。计算机已经发展成人们生活中不可或缺的一部分,在生活、娱
乐、工作中都占据着重要的位置,计算机的功能和性能也在不断的
加强,如何使计算机与人之间能更加友好的交互是信息技术研究的
重点。人类可以通过视觉、听觉、嗅觉、触觉捕获信息,人与人之
间甚至可以通过眼神、动作完成信息传递,人与计算机的交互变成
人与人之间交流一样便捷是人机交互的最终目标。人类承载信息的
方式主要包括声音、图像、语言和文字,而文字信息的作用是任何
一种方式无法取代的。史书上的文字记载让后人更清晰的了解过
去,传承文化;日常办公中的合同、发票、文档都是通过文字存储
信息[1]。许多人机交互研究学者对文字的研究高度重视,在早期的
研究性计算机中采用穿孔卡方式输入,到后来采用键盘鼠标输入方
式,再到如今的触摸屏输入以及语音输入,每次人机交互的革新,
都是计算机技术的进步。随着计算机以及便携移动设备的普及,如
智能、平板电脑、多功能手表等等,在当前生活模式下每日的信息
产量剧增,人机交互的效率成了信息时代发展的难题,如何能智能
的对人类语言、文字以及动作做出快速识别成了学术界和科技企业
界的研究热点。
1.2国内外研究现状
在上个世纪60年代,美国IBM公司开始进行了对印刷体汉字的模
式识别研究工作,1996年Casey和Nag用模板匹配法成功的识别出
了1000个印刷体汉字,在全球范围内,汉字识别开始展开了。而就
在这个时候,研究界对手写汉字识别也掀起了高潮。因为汉字在日
语中占有一定的地位,手写体汉字识别在一开始是由日本率先尝试
研究的,在80年代,国内开始了对手写汉字的研究,因为汉语作为
我们的母语,汉字主要在我国广泛使用,对汉字的种类、内涵、造
字原理国内的掌握情况较透彻,所以关于手写汉字识别的深入研究
主要集中在国内,国外对英语研究兴趣浓厚,对汉字的研究相对较
为单一。脱机手写汉字识别有着广泛的前景,将已经写好的汉字文
本,通过仪器扫描生成文本图像,将文档转换成数字信息,利用这
些数字信息将图像中的汉字识别出来,这一研究在实际生活中具有
非常实用的价值,例如可以应用在邮件分拣、财税、金融等领域,
实现自动化识别,减少人工操作,节省时间有节省人力,方便人们
的生活。
第2章相关技术概述
2.1引言
深度学习是机器学习的子领域,交叉了多领域知识,最基本的有神
经网络、人工智能,为了实现人工智能,通过模拟人脑,建立神经
网络,模拟人的思维方式下对数据的处理机制来解释数据,是基于
表征学习的多层次的机器学习算法。表征学习的目标是寻找更好的
表示数据方法[21],并这对这种方法创建一个模型来学习数据特
征,例如一张图片中,可以用强度值矩阵表示像素,图片就是作为
一个观测值,这就是一种表征学习方法,这些方法可以简化学习任
务。深度学习可以理解为传统的神经网络的扩展,如图2-1所示,
深度学习与传统的神经网络有很多相似的地方,深度学习采用了与
神经网络相类似的分层次网络结构,包括输入层、隐层、输出层,
但是其中隐层可以无限扩展,层与层之间的节点全连接,层内无连
接。
2.2浅层学习和深度学习
在机器学习的发展史中,深度学习经历了两个重要阶段,先后为浅
层学习和深度学习。浅层学习是机器学习的第一次浪潮,目前大部
分的分类、回归算法都属于浅层结构,一般浅层结构只包含1层或
者2层。典型的浅层学习方法有高斯混合模型(GaussianMixture
Model,GMM)、隐马尔科夫模型HMM、条件随机场(Conditional
RandomField,CRF)、最大熵(MaxEnt)模型、支持向量机SVM、逻
辑回归、核回归、多层感知机等。浅层学习都是将原始输入信号或
特征转换到特定问题的特征空间中,对于解决一些简单问题或者某
些受限问题有很好的效果。但是随着数据量的增多,浅层学习出现
了短板,训练方法时需要很多经验和技巧,对一些复杂函数的处
理,其建模能力和表征能力有一定的局限性,对于语音处理、自然
图像处理的能力较弱。而深层次学习,通过层次逐渐加深,对复杂
函数的计算能力被加强,显示出从小样本集中学习数据本质特征的
能力。
文档评论(0)