- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
印刷体文字的识别研究方法分类介绍.pdf
印刷体文字的识别研究方法分类介绍
识别方法是整个系统的核心。用于汉字识别的模式识别方法可
以大致分为结构模式识别、统计模式识别及两者的结合。下面分别进
行介绍。
结构模式识别
汉字是一种特殊的模式,其结构虽然比较复杂,但具有相当严格
的规律性。换言之,汉字图形含有丰富的结构信息,可以设法提取含
有这种信息的结构特征及其组字规律,作为识别汉字的依据,这就是
结构模式识别。
结构模式识别是早期汉字识别研究的主要方法。其主要出发点是
汉字的组成结构。从汉字的构成上讲,汉字是由笔划(点横竖撇捺等)、
偏旁部首构成的;还可以认为汉字是由更小的结构基元构成的。由这
些结构基元及其相互关系完全可以精确地对汉字加以描述,就像一篇
文章由单字、词、短语和句子按语法规律所组成一样。所以这种方法
也叫句法模式识别。识别时,利用上述结构信息及句法分析的方法进
行识别,类似一个逻辑推理器。
用这种方法来描述汉字字形结构在理论上是比较恰当的,其主要
优点在于对字体变化的适应性强,区分相似字能力强;但是,在实际
应用中,面临的主要问题是抗干扰能力差,因为在实际得到的文本图
象中存在着各种干扰,如倾斜,扭曲,断裂,粘连,纸张上的污点,
对比度差等等。这些因素直接影响到结构基元的提取,假如结构基元
不能准确地得到,后面的推理过程就成了无源之水。此外结构模式识
别的描述比较复杂,匹配过程的复杂度因而也较高。所以在印刷体汉
字识别领域中,纯结构模式识别方法已经逐渐衰落,句法识别的方法
正日益受到挑战。
统计模式识别
统计决策论发展较早,理论也较成熟。其要点是提取待识别模式
的的一组统计特征,然后按照一定准则所确定的决策函数进行分类判
决。
汉字的统计模式识别是将字符点阵看作一个整体,其所用的特征
是从这个整体上经过大量的统计而得到的。统计特征的特点是抗干扰
性强,匹配与分类的算法简单,易于实现。不足之处在于细分能力较
弱,区分相似字的能力差一些。常见的统计模式识别方法有:
(1) 模板匹配。模板匹配并不需要特征提取过程。字符的图象直
接作为特征,与字典中的模板相比,相似度最高的模板类即为识别结
果。这种方法简单易行,可以并行处理;但是一个模板只能识别同样
大小、同种字体的字符,对于倾斜、笔划变粗变细均无良好的适应能
力。
(2)利用变换特征的方法。对字符图象进行二进制变换(如Walsh,
Hardama 变换)或更复杂的变换(如Karhunen-Loeve, Fourier,Cosine,
Slant变换等),变换后的特征的维数大大降低。但是这些变换不是旋
转不变的,因此对于倾斜变形的字符的识别会有较大的偏差。二进制
变换的计算虽然简单,但变换后的特征没有明显的物理意义。K-L 变
换虽然从最小均方误差角度来说是最佳的,但是运算量太大,难以实
用。总之,变换特征的运算复杂度较高。
(3)投影直方图法。利用字符图象在水平及垂直方向的投影作为
特征。该方法对倾斜旋转非常敏感,细分能力差。
(4)几何矩(Geometric Moment)特征。M. K. Hu 提出利用矩不变量
作为特征的想法,引起了研究矩的热潮。研究人员又确定了数十个移
不变、比例不变的矩。我们都希望找到稳定可靠的、对各种干扰适应
能力很强的特征,在几何矩方面的研究正反映了这一愿望。以上所涉
及到的几何矩均在线性变换下保持不变。但在实际环境中,很难保证
线性变换这一前提条件。
(5)Spline 曲线近似与傅立叶描绘子(Fourier Descriptor)。两种方法
都是针对字符图象轮廓的。Spline 曲线近似是在轮廓上找到曲率大的
折点,利用Spline 曲线来近似相邻折点之间的轮廓线。而傅立叶描绘
子则是利用傅立叶函数模拟封闭的轮廓线,将傅立叶函数的各个系数
作为特征的。前者对于旋转很敏感。后者对于轮廓线不封闭的字符图
象不适用,因此很难用于笔划断裂的字符的识别。
(6)笔划密度特征。笔划密度的描述有许多种,这里采用如下定
义:字符图象某一特定范围的笔划密度是在该范围内,以固定扫描次
数沿水平、垂直或对角线方向扫描时的穿透次数。这种特征描述了汉
字的各部分笔划的疏密程度,提供了比较完整的信息。在图象质量可
以保证的情况下,这种特征相当稳定。在脱机手写体的识别中也经常
用到这种特征。但是在字符内部笔划粘连时误差较大。
(7)外围特征。汉字的轮廓包含了丰富的特征,即使在字符内部笔
划粘连的情况下,轮廓部分的信
您可能关注的文档
- 刺五加叶中黄酮类化合物的分析.pdf
- 前道生产工艺.pdf
- 力管理——一种人力资源管理的视角.pdf
- 功能语法与汉语语法研究.pdf
- 加强公务员诚信建设的措施探究_张道理.pdf
- 加强内控运用ERP提升企业管理水平.pdf
- 加强创新型监狱警察队伍建设的思考.pdf
- 加强和改进党的建设与构建和谐社会的统一.pdf
- 加强学生实验意识培养的实践与思考.pdf
- 加强实践教学培养应用型人才研究苏文平.pdf
- 2025年甘肃省临夏回族自治州单招职业倾向性测试题库带答案ab卷.docx
- 新手期货知识培训课件.pptx
- XXXX年CQC的3C认证工厂要求教材.pptx
- 2025年甘肃省临夏回族自治州单招职业倾向性测试题库含答案(精练).docx
- 可口可乐公司业代培训全套教程消费者决策过程(ppt230).pptx
- 2025年甘肃省临夏回族自治州单招职业倾向性测试题库(考点提分).docx
- 2025年甘肃省临夏回族自治州单招职业倾向性测试题库及答案1套.docx
- 2025年甘肃畜牧工程职业技术学院单招职业适应性测试题库(培优a卷).docx
- 2025年甘肃畜牧工程职业技术学院单招职业适应性测试题库附答案(综合题).docx
- 2025年甘肃畜牧工程职业技术学院单招职业适应性测试题库附答案(综合题).docx
文档评论(0)