- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2013年建模优秀论文碎纸片的自动拼接复原技术研究1_精品
2013高教社杯全国大学生数学建模竞赛
承 诺 书
我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛MATLAB软件对各图片进行了像素化处理,得到了每张图片的像素点矩阵;其次,手工提取每个像素点矩阵的首列和末列,组成像素点数组;接着,建立数学模型,运用JAVA编程对进行像素点数列组按照相似度进行自动排序;最后,根据排序结果,再次运用MATLAB软件对碎纸片做到了自动拼接复原。具体如下:
问题一:对同一页印刷文字文件碎纸用MATLAB附件12中图片数据化用JAVA编程对数据MATLAB软件对碎纸片做到了自动拼接复原的结果。
问题二:,纵切横切,问题三:双面打印文件横纵切的碎片,用MATLAB实现数据化,形成碎片文件数量相等的两部分,记录其中一部分的排序即得出原文件一面排序,另一部分排序则与前一部分每行顺序颠倒且编号为ab相对应用JAVA编程排序MATLAB对碎纸片做到了自动拼接复原的结果。
关键字:碎纸片拼接 MATLAB 像素化 JAVA编程 相似度 :第张图片右侧数据与第张图片左侧数据的差;
:第张图片下侧数据与第张图片上侧数据的差;
:的纵向和;
:的横向和;
:附件1、2在 MATLAB中用函数imread所读取图片文件中数据;
:附件3、4 在MATLAB中用函数imread所读取图片文件中数据。
问题分析
常规文档碎纸片计算机拼接方法一般利用碎片边缘的尖点特征、尖角特征、面积特征等几何特征,有哪些信誉好的足球投注网站与之匹配的相邻碎纸片并进行拼接,这种基于边界几何特征的拼接方法并不适用于边缘形状相似的碎纸片。但是人手撕裂碎纸片时,为节省时间习惯上总是先将碎纸片重叠在一起,然后撕裂,再将碎纸片重叠起来,再继续撕裂,这样反复下去,直到得到满意大小的碎纸片为止。这种撕裂过程会产生很多形状非常相似的碎纸片,拼接时如果只利用碎片的边界特征,拼接效果并不理想。
对这类边缘相似的碎纸片的拼接,理想的计算机拼接过程应与人工拼接过程类似,即拼接时不但要考虑待拼接碎纸片边缘是否匹配,还要判断碎片内的字迹断线或碎片内的文字内容是否匹配,然而由于理论和技术的限制,让计算机具备类似人那种识别碎片边缘的字迹断线、以及理解碎片内文字图像含义的智能几乎不太可能。但是利用现有的技术,完全可以获取碎片文字所在行的几何特征信息,比如文字行的行高、文字行的间距等信息,拼接碎片时如利用这些信息进行拼接,其拼接效率无疑比单纯利用边界几何特征方法要好些。
由于大多数文字文档的文字行方向和表格线方向平行且单一,如果碎片内的文字行或表格在碎片边缘断裂,那么与它相邻的碎纸片在边缘处一定有相同高度、相同间距的文字行或表格,凭此特征可以很容易地从形状相似的多碎片中挑选出相邻碎片。因文字行或表格线的高度特征、间距特征的识别比字迹断线识别和文字图像的理解实现起来要容易得多,利用碎片内文字行特征或表格特征拼接形状相似的碎纸片理论上是可行的。
另一方面由于计算机数字分析图像能力的缺陷,让计算机对碎片进行完全意义上的自动化拼接也几乎是不太可能,为保证拼接的准确性,需要在拼接过程中加入人工干扰过程。一般而言拼接碎片时先利用计算机有哪些信誉好的足球投注网站与目标碎片匹配的未拼接碎片,并根据匹配程度按顺序显示待选碎片,操作员再根据人脑进一步分析结果舍弃或拼接待选碎片。这种半自动拼接方法综合利用了计算机高速计算能力以及人的文字图像识别和理解能力,拼接效率比纯人工高拼接准确率也好于纯计算机拼接法。本文将详细研究这种基于文字特征,表格特征的碎片半自动拼接方法。
模型的建立和求解
问题一:
解题思路
首先,对原题附件1,2中的各19张图片进行像素化处理,(所谓像素化,就是通过计算机软件把图像分割成若干个小方格,每个小方格称为一个像素点,计算机通过表示这些像素点的位置、颜色、亮度等信息,从而表示出整幅图像。)得到了每张图片的像素点矩阵;其次,提取每张图片的像素点矩阵中最左边和最右边的数据,并进行编号,得到1980×38矩阵,接着,用每张图片最右边的数据和其他图片最左边的数据进行相似度计算,并按相似度从小到大排序;最后,相似度最大两张图片就是应该拼接在一起的,再考虑剩下的其他数据就可以得到最终的拼接结果。为了清楚的描述我们的思路,建立流程图如下(图1):
图1 问题处理流程图
像素化 数据的提取 排序
(二)模型的建立与求解
1.像素化求解
运用MATLAB中imread函数将原题中附件1,2中每张图片进行像素化处理,得到每张图片的像素值,编程如下(表1):
将以上编程输入MATLAB,运行后得到19个1980×72的矩阵,
表1 附件1、2中各图片像素化MATLAB程序 原题附件1: 原题附件2: I1=imread
文档评论(0)