网站大量收购独家精品文档,联系QQ:2885784924

《以贝叶斯定理为架构的基于手写字体应用的可形变模版识别.docVIP

《以贝叶斯定理为架构的基于手写字体应用的可形变模版识别.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《以贝叶斯定理为架构的基于手写字体应用的可形变模版识别

以贝叶斯定理为架构的基于手写字体应用的可形变模版识别 张国伟 ,电器和电子工程师协会学生成员 杨秩炎 ,电器和电子工程师协会成员 罗兰·T·秦, 电器和电子工程师协会成员 摘要——有见于可变模型对大形变对象的处理能力,最近人们对于许多模版识别应用都提议运用可变模版技术。此法就是将模版或形状作为可变模型,靠改变自身去迎合输入的图像,然后将萃取的信息导入分类器。 这三个部分——建模,匹配和分类——经常被视为独立的任务过程。而在此论文中,我们将学习如何把可变模型集成于贝斯定理架构内,从而使其成为一个对形状建模、匹配、分类的统一方法。并以手写字体识别作为评价这一方法的试验平台。通过对我们系统的使用,无论是仿射变换或其他笔迹变化,都能识别无误。甚至不需要预处理和过多的手工参数设置(如对参数的归一化和字体长度的调整)。除此之外,我们还研究这一问题:如何结合模型适应性约束、加速和子部检测。即便使用只有23个原形的模型集,且无须让软件对识别手迹进行学习,我们的精确度亦可达94.7%,并对NIST SD-1数据集中任何手写阿拉伯数字都不加拒认。 索引条目——可变模型,贝叶斯推理,笔迹辨识,预期最大化,NIST数据库。 1.介绍 1.1.可变模版识别 基于模型库识别是靠在输入图像中查找预模型而实现的,它的表现和定位有决定性作用,然后才能对其类别分类。通过对具有改变形状能力的可形变模型(DM)的使用,此方法可被用于柔性模版中,如人脸、细胞、手势或手写字体。藉由可形变匹配中提取柔性形状,模型形变和数据失配的量化将由两个判别函数进行:其一负责量度其模型形变程度,其二负责量度数据和形变模型的差别。而最佳匹配就是在此二判别标准的估量总和中取最小值。这估量因数是所谓的正则化参数,它令模型形变和数据失配之间产生一个平衡。通过定义一堆这样的模型,达到区分多种模型类别,而每个模型都包含与其相关的的形状信息,形状的允许形变范围则由预信息或通过软件学习而确定。在现有文献中,这些识别过程的步骤时常被视为分离的,仿佛它们是独立的部分。 1.2. 基于可形变模型库的笔迹辨识的前期工作 由于我们可以使用大量现实数据和很多不同风格的笔迹,所以笔迹识别已被用作基于可形变模型库的识别的绝好试验平台,而且在这论文中亦用于评价我们提出的这一系统。在现有文献中,对基于可形变模型库手写数字识别,已有不错的研究。Wakahara提出用于匹配字体形状骨架的局部仿射变换(LAT),这一方法是通过加入一系列点而表现出来的。字体的形变通过邻近的局部仿射变换参数的平滑度来测量,这种测量对球状仿射数据是不变的。数据的错配通过每个数据点到模型的设定数据点的最小距离来测量。Least-squares设置用于最小化,而规则化参数是人手设定的。分类基于差异点的测量。每个原形分类的数字就是一个如此的东西。通过对2,400个数字映象的测试达到的识别率、置换率和拒绝率分别为96.8%、0.2%和3%。Revow et al的研究则把数字模拟成弹性的齿条模型。可变性的模型是通过齿条控制点和涉及向量的Mahalanobis距离测定的。假定输入为二值图,黑像素的分布由高斯分布以及均匀分布的齿条模拟而成,数据的不匹配被定义为反对数的似然函数。 最小化的计算通过最大期望值算法来计算,手动设置正则化参数。经BP神经网络的分类,它要萃取一些输入分量,如可形变模型、数据错配和仿射变换参数。每个分类原形就是一个如此的东西。基于CEDAR数据库,最好结果:好的bs的测试组得到1.5%替代率,bs得到3.14%替代率,并且无拒绝。在单独学习时,Jain et al. [5]从智能像素边界模版模拟数字。由一系列置换功能系数构成的平方数来测量。数据错配被定义为模版和输入之间的边缘差异量。经确定斜率算法完成最小化,亦由正则化参数手动设置而成。两个不同量的加权总量达到分类。每一个分类原形大约为二百个,它大大地给此方法一个最邻近分类器的非参特性。根据二千个数字图的NIST SD-1数据集子集,最低的替代率可以达到0%、拒绝率为0.75%。以上的简要说明并无尽述详情,但体现出以下两点: 可形变模型库方法对手写识别应用非常见效。 不同的可形变模型库识别部分通常单独处理,而不整合为一个完整统一的计算架构。 1.3.论文概述 本文中,我们以Revow et al. [8]提出的可形变模型库识别系统作为基础,研究可形变模型库如何完整地代入贝叶斯模型,提供一个用于建模、匹配、分类独立手写字体的完整计算架构。为将我们的系统区别于Revow et al的,我们应用的组合不需手动输入超参数的预处理。此参数值自动设定为集成架构的一部分。这种改进使我们的系统比其他的应用系统更有适应力和移植能力。并且不同于那些用有辨别能力分类器——如BP神经网络——似

文档评论(0)

1983xuesheng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档