- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
手写体字符细化算法的研究
摘要:字符细化是手写体识别预处理中的关键技术,细化结果的好坏直接关系到识别率的高低。由于手写字符的多样性和随意性,目前没有统一的细化算法,因此细化算法的研究受到越来越多学者的关注。该文以非粘连字符作为研究对象,对基于模板的细化算法进行研究。采用FPA细化算法、SPTA细化算法、改进的Hilditch细化算法进行理论分析和编程实现,通过对比细化效果,分析了几种细化算法的优缺点。
关键词:手写体字符;细化;FPA算法;SPTA算法;Hilditch算法
字符细化,即提取字符仅有一个像素宽度的字符骨架,因此也称为字符骨架化[1]。字符骨架化的过程是在保障像素间能够拓扑连接的前提下,对整幅图像的边缘像素进行连续擦除的处理,最终保留仅一个像素宽度组成的字符。
字符进行细化处理后能够消除字符图像中包含的冗余信息,避免不相关因素(如,手写字符的粗细)的干扰,减少计算机的运算量,进而使识别时间缩短。采用不同的字符细化算法提取到的字符骨架不同,会直接影响到在字符骨架的基础上提取的字符特征的好坏,最终对字符识别的正确率产生影响。因此,字符细化算法的研究显得尤为重要。
1字符细化算法研究
1.1FPA细化算法
针对经过二值化处理的手写字符图像中的任意一像素,选取周围的窗口做判断处理,如图1所示。FPA方法[2]的原理,将笔划的外围黑像素进行逐层的剥除,最终保留属于字符骨架的像素点。为了确保骨架提取的连续性,将每次处理又分解成两次子处理。
第一次子处理:从所选窗口区域的东南边界和西北角对满足式a)、b)、c)、d)的黑像素点进行剥除处理;
第二次子处理:从所选窗口区域的西北边界和东南角对满足式a)、b)、c)、d)的黑像素点进行剥除处理;
反复执行以上两次子处理,直到得到字符骨架为止。
a)2≤B(P1)≤6;
b)A(P1)=1;
c)P2×P4×P6=0;c)P2×P4×P8=0;
d)P4×P6×P8=0;d)P2×P6×P8=0;
其中,A(P1)表示P2,P3,P4,P5,P6,P7,P8,P9,P2序列中出现01对的个数,B(P1)表示1在P1的周围八邻域窗口内出现的个数。公式a)用来限制字符骨架的端点不被剥离,公式b)保障字符骨架中间点的存留,如图2所示。公式c)、d)和公式c)、d)分别用来确保细化过程中只剥离东南边和西北角、西北边和东南角中不属于字符骨架的冗余点。
运用此算法对实验分割后的单个汉字进行细化,部分实验结果如下:图3为原图,图4为原图取反后的图,图5为实验得到的细化图。
1.2SPTA细化算法
SPTA算法[3]同样选取的窗口进行冗余点剥离处理。与FPA算法的不同点是从图像的上、下、左、右四个方向出发对字符进行细化处理。以P点为中心的的周边区域,如图6(e)所示。P点的8―近邻用于决定点是否可剥离,表示为序列Q,其中Q={n0,n1,n2,n3,n4,n5,n6,n7}。
如果序列Q符合图6(a),6(b),6(c),6(d)所示情况的任何一种,则表示为字符的右边界点、上边界点、左边界点和下边界点。下面对字符的细化过程加以说明,并以右边界点为例。
安全点的评判以公式(1)―(4)的布尔函数为判断准则:
同理,字符的左、上、下边界点的判断分别依据表达式(2)、(3)、(4)的返回值。SPTA算法进行字符细化一般情形下需进行多轮检查,每轮检查又分成两次扫描,每次扫描检查字符图像的单个像素点。整个过程既可以逐行扫描亦可逐列扫描。首次扫描的目的是检查所有的左、右边缘点,将非安全点做以标记;第二次扫描对上、下边缘点进行同样的处理。当一轮扫描操作完成后,不再有被标记的点,则将所有被标记的点进行剥离处理,表示算法循环结束。否则,需进行新一轮扫描。
运用此算法对实验分割后的单个汉字进行细化,部分实验结果如下:图7为原图,图8为原图取反后的图,图9为细化后的结果。
1.3改进的Hilditch细化算法
本文所采取的方法在经典Hilditch细化[4-5]算法(利用连接数Nc的基本串行算法)的基础上加以改进。依据图像腐蚀原理,考虑每个像素点的8―邻域以及8―邻域周围像素点的情况。分析像素点之间的关联情况,重新调整Hilditch算法所设定的限制条件。该方法在对字符细化的过程中,更加充分的考虑了各个像素,改进后的限制条件在不丢失关键点的同时能更加高效的剥离冗余像素点。
考虑一个像素点的8―邻域以及8―邻域周围像素点的情况示意图,如图10所示:
以上方法即为考虑周围25个点区域的方式。以P0点为例进行说明,在仅考虑8―邻域的情况下,当P0、P2、P3、P4为黑点,其余的点均为白点时,P0点并不可以直接剥离。因为仅考虑
您可能关注的文档
- 浅谈地理教学中微博的“妙”用.doc
- 浅谈地理社团建设中存在的问题与对策.doc
- 浅谈第三方物流存在的问题与对策.doc
- 浅谈对高校学籍档案数字化管理建设的几点思考.doc
- 浅谈多媒体环境下的历史教学.doc
- 浅谈多媒体技术在博物馆展览中的应用.doc
- 浅谈儿童舞蹈教学的特点.doc
- 浅谈访谈式教学法在思想政治课堂当中的运用.doc
- 浅谈粉末冶金生产工艺的发展现状.doc
- 浅谈高校公共选修课考试的改革.doc
- 2025年市总工会党组书记、市委组织部部长生活会“四个带头”个人对照检查发言材料2篇(含上年度整改+个人情况、个人事项+典型案例).docx
- 2025年部编版小学六年级下册《道德与法治》第四单元 让世界更美好第10课 我们爱和平教学课件.pptx
- 公司领导班子2025年围绕“四个带头”主题检视问题整改落实方案与组织生活会批评意见(20条)2篇文.docx
- 教育系统党组班子2025年对照“四个带头”含意识形态、以典型案例举一反三解析检视材料【2篇文】.docx
- 2025年国有企业领导班子、学校副校长生活会“四个带头”方面对照个人检视发言材料2篇文(附:上年度整改情况、典型案例解析).docx
- 2025年生活会“四个带头”个人对照检查材料2篇文(含对其他领导批评意见,个人公开事项申报、意识形态).docx
- 2025年国有企业党委书记、领导班子生活会“四个带头”方面对照检查发言材料2篇文(上年度整改情况).docx
- 乡镇领导班子、市委组织部常务副部长2025年对照“四个带头”含违纪行为为典型案例的剖析与反思检视剖析材料{2篇文}.docx
- 市委社会工作部2025年生活会领导班子对照检视发言材料2篇文(含以案为鉴,深刻反思存在问题、反面典型案例举一反三解析、其他需要说明情况).docx
- 2025年民主生活会、组织生活会批评意见(20条)与市直单位领导班子“四个带头”对照检查材料【含上年度查摆问题整改落实情况】2篇文.docx
文档评论(0)