关于深度学习在手写汉字识别中的应用综述.docVIP

下载本文档

20
0
约5.91千字
约 10页
2017-02-19 发布于河北
举报
版权申诉

关于深度学习在手写汉字识别中的应用综述.doc

1、本文档共10页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

关于深度学习在手写汉字识别中的应用综述

关于深度学习在手写汉字识别中的应用综述　由于在拍照文档、支票、表单表格、证件、邮政信封、票据、手稿文书等光学字符识别(Optical character recognition, OCR) 图像识别系统以及手写文字输入设备中的广泛应用前景, 自从上个世纪80 年代以来, 手写汉字识别(Handwritten Chinesecharacter recognition, HCCR) 一直是模式识别的一个重要研究领域, 得到了学术界的广泛研究和关注. 手写体汉字识别由于数据采集方式不同可以划分为脱机(Osup2;ine) 手写体汉字识别和联机(Online) 手写体汉字识别两大类. 联机手写汉字识别所处理的手写文字是书写者通过物理设备(如数字笔、数字手写板或者触摸屏) 在线书写获取的文字信号, 书写的轨迹通过定时采样即时输入到计算机中. 而脱机手写文字识别所处理的手写文字是通过扫描仪或摄像头等图像捕捉设备采集到的手写文字二维图片. 由于识别的对象不同, 使得这两类手写识别技术所采用的方法和策略也不尽相同. 前者的识别对象是一系列的按时间先后排列的采样点信息, 而后者则是丢失了书写笔顺信息的二维像素信息,由于没有笔顺信息, 加之由于拍照扫描设备在不同光照、分辨率、书写纸张等条件下, 数字化会带来一定的噪声干扰, 一般来说, 脱机手写文字识别比联机手写文字识别更加困难.手写汉字识别是一个极具挑战性的模式识别及机器学习问题, 主要表现在: 　　1) 中文汉字字符级别的类别繁多, 仅1980 年制定的国标GB2312-80 编码就定义了多达6 763 类常用汉字, 远远高出英语、拉丁语等通常只有几十类数目的西方语言. 然而此编码标准仍然不能满足汉字信息处理的需求, 所以在2000 年发布的国标GB18010 第一版(GB18010-2000) 大幅度扩展了字符集, 定义了27 533 类汉字编码标准, 并成为汉字信息处理产品必须遵循的强制性执行标准; 此后2005年发布的国标第二版(GB18010-2005) 更是新增加了42 711 个汉字和多种少数民族文字等字符, 收录的字符类别高达70 244 类汉字. 　　2) 相比较于印刷体汉字, 手写体字符的书写随意性大, 缺乏规范性, 人们经常使用的横、竖、撇、捺、点等笔划容易变形, 如直笔划变弯, 折笔划变成圆弧, 短横、短竖变成点, 点变成捺等, 笔划的倾斜角、笔划的相对长度不稳定; 连笔、笔划不清, 笔划之间的连接关系可能发生变化, 不该连的连上了, 该连的反而没有连; 笔划不清、缺笔等现象时有发生.这些都给识别造成了很大的困难; 另外, 不同书写人书写风格多样和存在明显差异, 出自不同书写者的同一类汉字在汉字字形, 汉字结构都会有明显的差异; 中国人口众多, 可以说几乎每个人都有自己的书写风格, 各种不同风格之间可能存在较大差异; 手写汉字的风格迥异, 从楷书、行书到草书, 识别难度逐渐提高. 　　3) 中文汉字中存在很多相似字和易混淆的汉字对, 例如: \已-己”、\口-囗”、\泪-汨-汩”、\雎-睢”、\汆-氽”、\睛-晴”、\海-诲”、\绞-纹”、\莱-菜” 等,这些高度相似的字符给计算机自动识别带来极大挑战. 　　4) 充分的训练数据及其多样性是设计和训练一个手写汉字识别系统的关键, 但目前针对大类别多风格的无约束手写数据库仍显不足. 数据库的采集和整理工作需要消耗大量人力物力来兼顾规模性和准确性. 北京邮电大学发布的HCL2000 脱机手写数据库及国家863 中文手写评测数据, 都是比较规范书写的数据; 相比而言, 目前能表现真实书写情况的手写单字数据库有中国科学院发布的CASIA-OLHWDB1.0-1.2 联机单字, 文本行数据集, 以及华南理工大学发布的涵盖单字、词组、文本行、数字、字母、符号等综合手写数据集SCUT-COUCH, 但上述两个较新的数据集类别局限于GB2312-80 标准的6 763 类, 并且数据总量仍然不够大.一般而言, 传统的手写中文单字识别系统主要　　包括数据预处理、特征提取和分类识别三部分: 　　1)数据预处理主要包括样本归一化、平滑去噪、整形变换、伪样本生成、添加虚拟笔画(对联机数据) 等; 　　2) 特征提取部分可以分为结构特征和统计特征两种, 结构特征主要对汉字结构、笔画或部件进行分析来提取. 但对手写字符而言, 目前最好的特征基本上都是统计特征, 例如方向特征. 对脱机HCCR 而言, Gabor 特征及Gradient 特征是目前比较好的两种方向特征提取方法; 对联机HCCR 而言, 8 方向特征[24]是目前最有效的特征之一; 　　3) 分类器最常用的模型包括改进的二次判决函数(Modie