- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
种手写体汉字快速细化分割算法
窖 耄 期 。 考 舀。走G赢 N报v tv v。‘ f
一 种手写体汉字快速细化分割算法
A QUICK THINNING AND SEGMENTATION AlgORITHM FOR
H^ND—PRINTED CHlNESE CHARACTERS
刘 平
Lid Ping
(重庆大学计葬机系)
摘 要 提出了一种基于游程编码(run length encoding)的手写体汉字细化和分割快速
算法。数据的输入与硅理并行,汉字图象数据所占存贮空问仅为点阵方式的l/d00。能将任阿
复杂汉字细化并分割为筒单直线和弧线笔划 对汉字的结构特征抽取极为有利。此外.本文
还提出一种新为边沿描述基段链码,其平均长度比Freeman链码短20 。
关键词 汉字识别;分离;平滑/边沿跟踪;链码f细化
中国图书资料分类法分类号 TP 39 J.4
ABSTRACT The paper prolx~ses a quick thinning and segmentation algorithm for hand—print—
ed Chinese character~going on simultaneously.The Inemoty space occupied by the character inlage
dam is only one four hundredth of that b the nortrtal character matrix.Any hand—printed Chinese
charaeer can be thinn0d and segm ented into several simple lines.arc an d corner strokes,It is very ef—
ficient for struetual feature extraction for Chinese characters.A now cha in code for edge deseription
is also proposed,wh0 e average chain eode length is about 20 less than that of Freeman chain
code.
KEY WORDS Chinese charac~r recognition;Sagmentafing;Smoathing/Contour tracing;
Chain code f Thinning
0 引 言
顼处理通常是文字识别不可缺少的重要阶段,其处理效果直接影响特征抽取,最终影响
识别精度。汉字识别预处理的主要困难是:
(1)汉字字符点阵较大(32×32以}=),存贮大量汉字的点阵数据要受到计算机可用内
存空间的限制。
(2)汉字笔划多,笔划问的变叠情况复杂。一般的细化方法较费时且易出现不可细化区
以及不必要的分岔口 ]。
(3)汉字结构复杂,笔划的分割既困难叉费时。针对上述问题,本算法使用的原始数据
’收文日期90·5·3
第】d卷第 期 刘 平: 一千中手写体汉字快速细化分割算法 79
为游程码(run length encoding)数据 它是由G3类传真机输入的Huffmnn编码数据解码而
得.数据压缩倍数约为1 0[ 。而且采用数据输入与处理并行的方法.任何时刻只保存当前两
相邻行上的游程码,不保存整字 若字符点阵行数为80,则所占存贮空阿仅为点阵方式的l/
(1ox 40)=1/4oo。
本算法利用G3类传真机作数字化输入设备,在IBM PC/AT机上实现。传真机与AT机
用一块智能接口卡连接.该卡以ZSO为CPU,实现数据缓冲和Huffman码到游程码的变换.
其系统硬件框罔如图l所示。
传统的细化算法大多基于中轴变 一 … … … … 一一
换以获得字符骨架,用这些算法对汉 “ ]_ j广_ P—
文档评论(0)