网站大量收购闲置独家精品文档,联系QQ:2885784924

汉字笔画自动提取系统的分析与实现-analysis and implementation of automatic chinese character stroke extraction system.docx

汉字笔画自动提取系统的分析与实现-analysis and implementation of automatic chinese character stroke extraction system.docx

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉字笔画自动提取系统的分析与实现-analysis and implementation of automatic chinese character stroke extraction system

摘要由于汉字在我国的特殊重要性,汉字识别有着广阔的应用前景,如在文献检索,办公自动化,邮政书信分拣,试卷的自动阅读等方面有着重要的实际意义,对我国信息化发展有着不可替代的作用。同时,汉字识别也是科学理论研究的一个重要组成方面,它的研究也将促进各学科的研究与发展。随着汉字识别的应用越来越普遍,应用系统中对汉字识别的速度和正确率的要求也越来越高,而汉字笔画提取通常是汉字识别的重要一步,一旦汉字笔画提取在正确率和速度上取得突破,汉字识别将随之取得突破。然而,由于汉字结构复杂,字符集庞大,不同字体的笔画在连接性,笔画长短、粗细方面各有不同,笔画与笔画之间、部件与部件之间的位置会发生变化,笔画的倾斜角会发生变化,这给笔画提取工作带来的大量的困难。本课题围绕汉字笔画自动提取的核心科学问题,主要研究汉字结构模型和视觉信息的高效计算,主要包括汉字部件拆分,交叉区域检测和笔画段组合的方法,并在此基础上实现汉字笔画自动提取。本课题提出的基于汉字拆分匹配的汉字笔画提取框架的有效性在不同字体的汉字笔画提取问题中得到验证。相关工作在一定程度上针对汉字交叉区域提取、汉字笔画段组合和汉字笔画自动提取等问题有所创新。针对汉字交叉区域提取问题,提出了一种高效的自适应交叉区域提取算法,克服了不同交叉区域形状大小不相同造成的困难,大大减少计算开销,仅花了传统基于PBOD的交叉区域提取算法5%左右的时间。为了高效的实现笔画段组合,我们提出一种基于夹角的笔画段组合方法,通过笔画段间夹角的绝对值判断笔画段组合的概率,这样避免大量的计算开销,与传统的笔画段组合算法相比,减少了大约75%的时间开销。对不同汉字结构进行研究,提出了一套高效的基于拆分匹配的汉字笔画自动提取机制,克服了传统从灰度图和从二值图中提取笔画时间开销大的问题。该方法与传统笔画提取算法的效果对比明显,平均提取时间减少了50%左右,同时对结构相对简单的汉字笔画提取效果非常理想。该笔画提取方法对于不同字体的汉字均能达到较好的提取效果,有效地改善汉字笔画提取准确度不理想,提取速度慢的不足,同时本系统在准确率和效率上具有很好的可扩展性。关键词:笔画拆分,笔画提取,笔画段组合,交叉区域提取ABSTRACTChinesecharacterrecognitionplaysanimportantroleinthedevelopmentofourstate’sinformationtechnology.Ithasbroadapplicationprospects,suchasdocumentretrieval,officeautomation,automaticletterclassification.Ontheotherhand,Chinesecharacterrecognitionisalsoanimportantcomponentofthescientificresearchwhosedevelopmentwillpromptfurtherachievementsinotherresearchareas.WithmoreandmoreapplicationsofChinesecharacterrecognition,thespeedandaccuracyofrecognitionishighlyrequired.Chinesecharacterstrokeextractionisakeystepinrecognition.However,consideringthesituationthatChinesecharactershavecomplexstructures,currentcharactersisnumerous,thejoints,shapeofeachstrokearevarious,therelativepositionsofcharactercomponentsineachcharacterorbetweentwodifferentcharactersaredifferent,thetiltangleofthesamestrokeintwocharacterswillchange,wearefacingalotofdifficultiesinautomaticstrokeextractionforChinesecharacter.Thisthesismainlyresearchesonthehigh-effectiveautomaticextractionofChinesecharacterstrokes,includingcharactercomponentsplitting,shapematching,cross-areadetectionandstrokesegmentscombination.F

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档