- 1、本文档共44页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
古籍汉字切分研究_大学生毕业设计论文
“挑战杯”全国大学生课外学术科技作品竞赛
参
赛
作
品
作品名称: 古籍汉字切分研究
学校名称: 河北大学
指导教师: 罗文劼 田学东
项目组成员: 邵建新 聂晓帆 李付民
张瑞文 贺王凯 夏正伟
摘要
华夏文明给我们留下了浩如烟海的文献典籍。这些文字历来是众多专家学者研究的对象。自20世纪70年代起,图像分割就以其在图像处理中的重要性受到人们的高度重视,也吸引了很多研究人员为之付出了巨大的努力。近年来,古籍数字化已经取得了令人瞩目的成就,但在为使用者提供快速便捷的检索手段的同时,带来了由于不能接触原典,丧失了接收许多隐性资料机会的缺点。
对于原典图片中的每一个字符,都可以采用计算机的手段进行分割、处理。采用这种图像处理和单字分割的手段对古代典籍进行研究,使传统文化的研究步入一个新的阶段。基于这样的研究背景与现状,我们通过C语言实现对古籍汉字的切分功能,具体分为以下三部分:
去噪声。因为古籍资料保存时间久远,所以会出现纸张变色、破损、文字残缺等现象,导致古籍手写汉字图像噪声很大。所以实现图像去噪对于我们后续的分割有着极其重要的作用,是图像分割的前续工作。我们拟用平滑滤波器处理的图像噪声去除技术实现此功能。
图像读写。BMP(全称Bitmap)是Windows操作系统中的标准,可以分成两类:设备相关(DDB) 和设备无关位图(DIB),使用非常广。
13域采用不同阈值造成的差异。对以此方法得到的二值化图像进行轮廓标记。对每个单个汉字的原图像区域,以刚得到的轮廓为窄带划分的依据,采用前述的窄带C—V算法,进行汉字图像的细致分割。
五、项目的科学性、先进性及独特之处
科学性在于,本作品首先通过扫描古籍资料的图文,获取研究样张,然后对样张进行切割算法的研究,然后再对切割的图片进行合理的重组,使得其信息清晰地显示出来。
先进性,本作品能够对一些考古等一类活动涉及到的古书籍所记载信息快速高效显示出来,能够大大减少对此类物品研究的时间,从而提高工作效率。
独特之处:通过通过对性能稳定的切分算法的设计,力图得到对古籍汉字较好的切分效果,以支持对古书籍字识别的研究。
正文
1基于平滑滤波器处理的图像噪声去除技术
1.1 图像文本去噪声的意义
因为古籍资料保存时间久远,所以会出现纸张变色、破损、文字残缺等现象,导致古籍手写汉字图像噪声很大,很多古籍的数字化往往只是按照研究者的理解,有时候会很难展现作者真正的意愿。所以实现图像去噪对于我们后续的分割有着极其重要的作用,是图像分割的前续工作。
1.2 基于平滑滤波器处理的图像去噪模型
图像去噪的困难度很大,为了有效地去除噪声,可以使用一些平滑滤波器对图像进行处理,例如:中值滤波,均值滤波,高斯滤波等。这些去噪方法建立在整幅图模糊的基础上,使图像变得平滑,改善了图像的质量,有利于抽取对象特征进行分析。但这些经典方法会使图片丢失边缘和纹理信息。因此我们这次采取的图像去噪的方法是TV法即全变分(TotalVariation)法,这种方法在去除噪声的同时能够很好的有效的保证图像的边缘信息。它的基本思想是:将图像去噪建模成一个能量函数最小化问题,使图像达到平滑状态,由于该方法引入了偏微方程的各向异性扩散方程用于图像去噪,在平滑噪声的同时,可以使边缘得以有效地保持,较好的解决了恢复图像细节和去除噪声之间的矛盾。
全变分(TV)图像去噪模型是由Rudin、OsherandFatemi提出的,已成为图像去噪以及图像复原中最为成功的方法之一。TV图像去噪模型的成功之处就在于利用了自然图像内在的正则性,易于从噪声图像的解中反映真实图像的几何正则性,比如边界的平滑性。
令f为原始的清晰图像,f0为被噪声污染的图像,即
f0(x,y)=f(x,y)+(x,y)(1)
式中n为具有零均值、方差为σ2的随机噪声。?表示图像的定义
域,像素点(x,y)∈?。
通常有噪声图像的全变分比无噪声图像的全变分明显大,最小化全变分(TV)可以消除噪声,因此基于全变分的图像降噪可以归结为如下最小化问题:minTV(f)=dxdy(2)
dy
1/||o)2dxdy=σ2
最小化式(1.2)可以等价于最小化下式:
o)2dxdy+dxdy
式中,第1项为数据保真项,它主要起保留原图像特性和降低图像失真度的作用;第2项为正则化项,参数为λ规整参数,对平衡去噪与平滑起重要作用,它依赖于噪声水平。其导出的欧拉-拉格朗日方程为:
-?()+(f-f0)=0
从该方程可以看出,扩散系数为 。在图像边缘处,|?f|较大,扩散系数较小,因此沿边缘方向的扩散较弱,从而保留了边缘;在平滑区域,|?f|较小,扩散系数较大,因
文档评论(0)