- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基干DSP字符识别系统设计与实现
基于DSP的字符识别系统的设计与实现 【摘 要】本系统(DSP)TMS320VC5509A应用图像处理和字符识别技术,拟实现对一张图片中单个字母与数字的识别、一行数字与字母的识别、多行数字与字母的识别、在同一行中字体大小不一的字母与数字的识别,以及部分汉字的识别等文字信息的处理和识别,并以可编辑的形式输出
【关键词】DSP CCS 数字图像处理 字符识别
随着计算机网络飞速发展,信息电子化已经成为一个时代的必然趋势。文字作为信息中最重要、最集中的载体,其电子化进程显得越来越重要。很多的电子图书、期刊文献和会议论文中都包含着大量有用的信息,但这些文件大都是以PDF格式进行保存的,只能以图片的形式查看,无法直接对其中的文字信息进行复制和编辑,因此如何快捷地获取这些文字信息,一直是困扰着人们的一个难题。本系统实现对字母以及部分汉字的识别和处理并以可编辑形式输出
1 系统设计方案(图一)
2 各部分原理
(1)灰度化彩色图像。实现将一张彩色RGB图像转换成灰度图[1]。日常生活中人们所见到的图像一般为彩色图像,其每个像素点的颜色值由三个字节组成,分别为R(红)、G(绿)、B(蓝)三个分量,每个分量占一个字节,因此每个像素点的颜色变化范围为0~255*255*255,如果对彩色图像直接进行处理识别的话会非常麻烦,因此本系统将所采集的彩色图像先进行了灰度化处理,使一个字节代表一个像素点,每个像素点的颜色值变化范围为0~255,从而很大程度上减少了运算量[2]
(2)二值化处理。灰度图像的二值化处理,就是将图像上像素点的灰度值设置为0或255,也就是使整个图像呈现出明显的只有黑和白的视觉效果,以便于后期对图像的进一步处理。二值化是图像处理中很重要的一步,二值化后的图像效果很大程度上影响到图像识别的准确率[3]
(3)分隔字符。通过算法处理,实现将每一个字符单独分割出来,以便于处理和识别。由于行与行之间、字符与字符之间都是存在空白间隙,利用这一原理可扫描并识别出每一行字符的上下边界,以及每一行中每一个字符的左右边界,从而将每个字符的上下左右边界确定[4],实现字符与字符之间的分割
(4)制作字符库。即制作出一套标准的参照数据库,每个字符都有自己独特的特征,可根据这些特征的不同来区分不同的字符。将分割后每个字符的数据信息与字符库进行特征对比和匹配,从而识别出该字符,最终输出并显示
3 各部分算法实现
3.1 灰度化彩色图像
读入彩色图像每一点的索引值,并将此索引值作为该点的灰度值,存入存放该图像的一位数组
3.2 二值化处理
首先求出图像的最佳阈值,我们采用了迭代法来计算,步骤如下:
(1)求出图像灰度的最大和最小值Hmax、Hmin,取初始阈值为其均值,即(Hmax+Hmin)/2,记作T(0);
(2)根据阈值T(k)将图像分为前后景,分别求前后景平均灰度值,在对其求平均,作为T(k+1);
(3)重复第2步,知道T(k+1) -T(k) 小于我们设定的精度极限,得到最佳阈值。得到最佳阈值后,再对像素点遍历,大于该值的改为255,小于的记为0[5]
3.3 分隔字符
得到二值化的图像后,需要将一个个的字符单独提取出来。我们利用了图像投影来分割字符
当我们把一行字符沿行方向投影后,我们可以看到一系列分离的堆,每一个堆代表一个字符,这样我们便可以记录堆间空白的位置信息来分割字符[6]
同理,沿列方向投影,我们可以分割出各个行
所以我们首先对图像进行行分割,再对各个行进行字符分割。需要注意,此时分割出的字符在列方向并不是完全去除了白边(由于行分割是对一行的投影,一行的字符高度并不一定相等),所以需要有一个调整的步骤,把分离出来的图像再沿行方向投影,从顶部和底部开始,分别找到第一个非零值后,即以此点位置开始裁剪
通过以上步骤即可得到一个个完全且仅包含一个字符的子图像
3.4 特征提取
英文字符和简单汉字的结构都不太复杂,我们选择用就一个九维向量来描述它的特征
我们求取上述步骤提取的字符子图像总的非零像素点数。然后将每个子图像等分为9区,求取每区非零像素点数占总点数的比值,作为特征向量的一个值[7]
3.5 制作字符库
该步骤需要获取标准字符的信息,我们利用Matlab的便捷来进行处理。对标准字符进行上述步骤处理后,会得到各个标准字符的特征向量,整理后作为模板,以待后续识别使用
3.6 匹配模板并输出
字符的识别部分采用了余弦算法,利用余弦定理来判断其与标准字符的相似性
4 测试结果
4.1 测试结果展示图二、图三(部分字符库字符识别)
4.2 可识别字符库
4.2.1 可识别的英文字
文档评论(0)