手写体字符细化算法的研究.docVIP

下载本文档

3
0
约3.34千字
约 4页
2018-01-18 发布于山东
举报
版权申诉

手写体字符细化算法的研究.doc

1、本文档共4页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

手写体字符细化算法的研究　　摘要：字符细化是手写体识别预处理中的关键技术，细化结果的好坏直接关系到识别率的高低。由于手写字符的多样性和随意性，目前没有统一的细化算法，因此细化算法的研究受到越来越多学者的关注。该文以非粘连字符作为研究对象，对基于模板的细化算法进行研究。采用FPA细化算法、SPTA细化算法、改进的Hilditch细化算法进行理论分析和编程实现，通过对比细化效果，分析了几种细化算法的优缺点。　　关键词：手写体字符;细化;FPA算法;SPTA算法;Hilditch算法　　字符细化，即提取字符仅有一个像素宽度的字符骨架，因此也称为字符骨架化[1]。字符骨架化的过程是在保障像素间能够拓扑连接的前提下，对整幅图像的边缘像素进行连续擦除的处理，最终保留仅一个像素宽度组成的字符。　　字符进行细化处理后能够消除字符图像中包含的冗余信息，避免不相关因素(如，手写字符的粗细)的干扰，减少计算机的运算量，进而使识别时间缩短。采用不同的字符细化算法提取到的字符骨架不同，会直接影响到在字符骨架的基础上提取的字符特征的好坏，最终对字符识别的正确率产生影响。因此，字符细化算法的研究显得尤为重要。　　1字符细化算法研究　　1.1FPA细化算法　　针对经过二值化处理的手写字符图像中的任意一像素，选取周围的窗口做判断处理，如图1所示。FPA方法[2]的原理，将笔划的外围黑像素进行逐层的剥除，最终保留属于字符骨架的像素点。为了确保骨架提取的连续性，将每次处理又分解成两次子处理。　　第一次子处理：从所选窗口区域的东南边界和西北角对满足式a)、b)、c)、d)的黑像素点进行剥除处理; 　　第二次子处理：从所选窗口区域的西北边界和东南角对满足式a)、b)、c)、d)的黑像素点进行剥除处理; 　　反复执行以上两次子处理，直到得到字符骨架为止。　　a)2≤B(P1)≤6; 　　b)A(P1)=1; 　　c)P2×P4×P6=0;c)P2×P4×P8=0; 　　d)P4×P6×P8=0;d)P2×P6×P8=0; 　　其中，A(P1)表示P2，P3，P4，P5，P6，P7，P8，P9，P2序列中出现01对的个数，B(P1)表示1在P1的周围八邻域窗口内出现的个数。公式a)用来限制字符骨架的端点不被剥离，公式b)保障字符骨架中间点的存留，如图2所示。公式c)、d)和公式c)、d)分别用来确保细化过程中只剥离东南边和西北角、西北边和东南角中不属于字符骨架的冗余点。　　运用此算法对实验分割后的单个汉字进行细化，部分实验结果如下：图3为原图，图4为原图取反后的图，图5为实验得到的细化图。　　1.2SPTA细化算法　　SPTA算法[3]同样选取的窗口进行冗余点剥离处理。与FPA算法的不同点是从图像的上、下、左、右四个方向出发对字符进行细化处理。以P点为中心的的周边区域，如图6(e)所示。P点的8―近邻用于决定点是否可剥离，表示为序列Q，其中Q={n0，n1，n2，n3，n4，n5，n6，n7}。　　如果序列Q符合图6(a)，6(b)，6(c)，6(d)所示情况的任何一种，则表示为字符的右边界点、上边界点、左边界点和下边界点。下面对字符的细化过程加以说明，并以右边界点为例。　　安全点的评判以公式(1)―(4)的布尔函数为判断准则：　　同理，字符的左、上、下边界点的判断分别依据表达式(2)、(3)、(4)的返回值。SPTA算法进行字符细化一般情形下需进行多轮检查，每轮检查又分成两次扫描，每次扫描检查字符图像的单个像素点。整个过程既可以逐行扫描亦可逐列扫描。首次扫描的目的是检查所有的左、右边缘点，将非安全点做以标记;第二次扫描对上、下边缘点进行同样的处理。当一轮扫描操作完成后，不再有被标记的点，则将所有被标记的点进行剥离处理，表示算法循环结束。否则，需进行新一轮扫描。　　运用此算法对实验分割后的单个汉字进行细化，部分实验结果如下：图7为原图，图8为原图取反后的图，图9为细化后的结果。　　1.3改进的Hilditch细化算法　　本文所采取的方法在经典Hilditch细化[4-5]算法(利用连接数Nc的基本串行算法)的基础上加以改进。依据图像腐蚀原理，考虑每个像素点的8―邻域以及8―邻域周围像素点的情况。分析像素点之间的关联情况，重新调整Hilditch算法所设定的限制条件。该方法在对字符细化的过程中，更加充分的考虑了各个像素，改进后的限制条件在不丢失关键点的同时能更加高效的剥离冗余像素点。　　考虑一个像素点的8―邻域以及8―邻域周围像素点的情况示意图，如图10所示：　　以上方法即为考虑周围25个点区域的方式。以P0点为例进行说明，在仅考虑8―邻域的情况下，当P0、P2、P3、P4为黑点，其余的点均为白点时，P0点并不可以直接剥离。因为仅考虑