网站大量收购独家精品文档,联系QQ:2885784924

融合字符及字符排列特征的铭牌识别方法.docVIP

融合字符及字符排列特征的铭牌识别方法.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
融合字符及字符排列特征的铭牌识别方法.doc

融合字符及字符排列特征的铭牌识别方法   摘 要: 传统铭牌字符识别主要通过计算铭牌字符图片的灰度平均值来判定,由于铭牌字符具有笔画方向特征、轮廓特征,同时字符之间存在着一定的排列特征。提出融合字符及字符排列特征的铭牌识别方法,首先对铭牌字符图片分别进行横、竖、撇三个方向上的小波变换,求出三个方向上的小波平均能量,再提取出字符的边缘方向直方图,以小波平均能量和边缘方向直方图构成特征向量,用支持向量机分类器训练并构建候选字符识别模型,得到候选字符,然后利用铭牌字符排列特点和铭牌的样本数据训练构建N阶马尔科夫字符排列模型,借助于模型对候选字符进行约束获得铭牌识别结果,最后对电力设备铭牌进行识别实验。结果表明,提出的方法表现了很好的效果,比OCR软件识别的准确率提高了12.6%。   关键词: 设备铭牌; 字符识别; 笔画方向特征; 轮廓特征; 字符排列特征   中图分类号: TN919?34 文献标识码: A 文章编号: 1004?373X(2016)22?0006?03   0 引 言   铭牌字符不同于具有白色背景的普通文档字符,它一般出现在彩色背景中,字符可能出现倾斜,而且字符数量远远少于普通文档,一般同时包含文字、数字和字母,识别这种字符对于设备的管理具有重要意义[1]。目前的铭牌字符识别是提取字符特征建立模版,利用模版匹配来进行字符识别。其中,字符特征的提取和匹配是最关键的部分。对于特征的提取,Yang等人提出以字符的孔洞数[2]、字符每一行由白到黑跳变的像素个数以及字符经过Gabor[3]变换之后的纹理特征来作为字符的识别特征;Chen等人提出以字符的小波能量[4]作为字符识别特征的方法,其中小波能量是一种细节特征,可以较好地体现字符在不同笔画方向上的频谱能量[5];Wei等人利用字符的开闭环特征[6]训练BP神经网络[7]来进行字符的识别,通过判断字符的形状有没有构成封闭的区域,以构成不同类型的封闭区域作为字符的识别特征。对于铭牌字符模版的匹配,传统方法是将字符分割成很多小块,然后计算出所有小块的灰度平均值[8]来进行匹配,字符中的汉字、数字和字母笔画弯折的部分具有丰富的笔画方向特征[9],通过小波变换可以把字符笔画方向的变化这一局部细节信息反映在频谱的高频部分,同时铭牌字符的轮廓线条存在着很多方向突变,具有丰富的形状轮廓信息,边缘方向直方图[10]可以体现字符的整体形状轮廓信息。铭牌上的内容一般是某一领域的相关术语,字符只有通过固定的排列才能构成这些术语,通过N阶马尔科夫方法[11]构建的字符排列模型可以体现出字符之间的特定排列特征。所以本文将它们融合在铭牌识别的特征提取和结果匹配中,提高铭牌字符识别的准确率。以电力设备铭牌识别实验为例,其结果也验证了本文提出方法的有效性。   1 铭牌字符预处理   在进行铭牌字符识别之前,需要对铭牌上的字符做预处理,包括字符图像的二值化、字符图像的去倾斜、以及字符图像的分割。设备铭牌的图像通常是彩色的,为了方便对字符的分割以及识别,首先要对字符图像进行二值化,本文采用全局最大方差阈值法来确定对字符图像进行二值化的灰度阈值K。设灰度图像的灰度级区间为[0,M],某一灰度级K将该区间分为两组,分别为[0,K]和[K+1,M],记为C0和C1,则这两个灰度区间之间平均灰度的方差为:   [δ2K=ω0μ0-μ2+ω1μ1-μ2=(μω(K)+μ(K))2ω(K)(1-ω(K))] (1)   式中:μ0和μ1分别为C0和C1的平均灰度;ω0和ω1分别为C0和C1所占像素点数量与总像素点数量的比值。在[0,M]之间不断变换K的值,直到求出式(1)中δ2(K)为最大值时的K值,这个值就是对字符图像进行二值化的灰度阈值K。到此,完成了设备铭牌上字符的灰度二值化。   由于拍摄角度的原因,设备铭牌上的字符会与水平线之间存在一个微小的夹角θ。为了方便特征的提取,需要对字符图像进行去倾斜。由于铭牌上的字符是横排书写的,即从左往右书写,对字符图像分别进行x轴和y轴方向上的投影,其投影长度分别为L1和L2,然后检测y轴上灰度值为1的起始点的坐标,其到x轴的距离记为L3,设字符图像的去倾斜角度为θ,则:   [θ=arctan L2-L3L1] (2)   对于设备铭牌上的字符,如果最左侧字符的y轴投影坐标大于最右侧字符的y轴投影坐标,则将整个字符的投影区域逆时针旋转去倾斜角θ即可,反之,则顺时针旋转去倾斜角θ即可。在进行字符图像的二值化和去倾斜之后,接下来进行字符图像的分割和归一化。设备铭牌字符的分割可分为行分割与字间分割,首先进行的是铭牌字符的行分割,对铭牌字符进行y轴方向的投影,可以得到铭牌字符在y轴方向的像素分布,在像素分布图中有一些地方为零,它们对应两行之间的

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档