- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《彩色桌面出版系统》上机实验指导书
《彩色桌面出版系统》
实验指导书
包装与材料工程学院
2012.3
实验一 原稿的输入
一、实验类型:验证性实验
二、实验目的与任务
掌握扫描仪的基本操作;
掌握反射及透射原稿扫描输入的参数设定;
掌握OCR文字识别技术。
分析不同参数设定下的图像质量和文字识别效果
三、预习要求
实验前查找资料,对平板扫描仪及其特点有所了解。熟悉实验步骤,掌握实验原理和方法。
四、实验基本原理
1.扫描仪的工作原理
自然界的每一种物体都会吸收特定的光波,而没被吸收的光波就会反射出去。扫描仪就是利用上述原理来完成对稿件的读取的。扫描仪工作时发出的强光照射在稿件上,没有被吸收的光线将被反射到光学感应器上。光感应器接收到这些信号后,将这些信号传送到数模(D/A)转换器,数模转换器再将其转换成计算机能读取的信号,然后通过驱动程序转换成显示器上能看到的正确图像。待扫描的稿件通常可分为:反射稿和透射稿。前者泛指一般的不透明文件,如报刊、杂志等,后者包括幻灯片(正片)或底片(负片)。如果经常需要扫描透射稿,就必须选择具有光罩(光板)功能的扫描仪。
2.扫描仪主要的技术指标
分辨率:分辨率是扫描仪最主要的技术指标,它表示扫描仪对图像细节上的表现能力,即决定了扫描仪所记录图像的细致度,其单位为PPI(Pixels Per Inch)。通常用每英寸长度上扫描图像所含有像素点的个数来表示。目前大多数扫描的分辨率在300~2400PPI之间。PPI数值越大,扫描的分辨率越高,扫描图像的品质,但这是有限度的。当分辨率大于某一特定值时,只会使图像文件增大而不易处理,并不能对图像质量产生显著的改善。扫描分辨率一般有二种:真实分辨率(又称光学分辨率)和插值分辨率。光学分辨率就是扫描仪的实际分辨率,它决定了图像的清晰度和锐利度的关键性能指标。插值分辨率则是通过软件运算的方式来提高分辨率的数值,即用插值的方法将采样点周围遗失的信息填充进去,因此也被称作软件增强的分辨率。例如扫描仪的光学分辨率为300PPI,则可以通过软件插值运算法将图像提高到600PPI,插值分辨率所获得的细节信息要少些。
灰度级:度级表示图像的亮度层次范围。级数越多扫描仪图像亮度范围越大、层次越丰富,目前多数扫描仪的灰度为256级。256级灰阶中以真实呈现出比肉眼所能辨识出来的层次还多的灰阶层次。
色彩数:色彩数表示彩色扫描仪所能产生颜色的范围。通常用表示每个像素点颜色的数据闰数即比特位(bit)表示。所谓bit这是计算机最小的存贮单位,以0或1来表示比特位的值,越多的比特位数可以表现越复杂的图像信息。例如常说的真彩色图像指的是每个像素点由三个8比特位的彩色通道所组成即24位二进制数表示,红绿蓝通道结合可以产生224=16.67M(兆)种颜色的组合,色彩数越多扫描图像越鲜艳真实。
扫描速度:扫描速度有多种表示方法,因为扫描速度与分辨率,内存容量,存取速度以及显示时间,图像大小有关,通常用指定的分辨率和图像尺寸下的扫描时间来表示。
扫描幅面:表示扫描图稿尺寸的大小,常见的有A4、A3、A0幅面等。
3.OCR文字识别技术
OCR (Optical Character Recognition光学字符识别)技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。主要处理步骤如下:
图像输入:需要OCR处理的文件须通过光学仪器,如扫描仪、传真机或其他输入设备,将图像转入计算机。一般来说,输入设备的分辨率越高,图像越清晰、OCR处理的效率越高。
图像处理:图像处理是OCR系统中须解决问题最多的一个模块,从得到一个不是黑就是白的二值化图像,或灰阶、彩色的图像,到独立出一个个的文字图像的过程,都属于图像处理。包含了图像正规化、去除噪声、影像矫正等的图像处理,及图文分析、文字行与字分离的文件前处理。
文字特征抽取:特征抽取是 OCR的核心,用什么特征、怎么抽取,直接影响识别的好坏。而特征可说是识别的筹码,简易的区分可分为两类:一为统计的特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就足以应付了。而另一类特征为结构的特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对,市面上的线上手写输入软件的识别方法多以此种结构的方法为主。当输入文字算完特征后,不管是用统计或结构的特征,都须有一比对数据库或特征数据库来进行比对,数据库的内容应包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组
您可能关注的文档
- 维修电工培训第六章(电气常见故障分析与排除).ppt
- 高压设备的倒闸操作及故障.ppt
- 学习任务3_检测诊断与排除制动系故障.ppt
- 计算机硬件初级维修.ppt
- 传输故障处理教案,以华为设备为例.ppt
- TA054301 ECC故障处理ISSUE1.0.ppt
- 第9讲 销售区域管理.ppt
- 基于分区分层技术的AGC稳定断面潮流的自动控制系统.doc
- 学习情景5_微机点火系统的检修.ppt
- 公差配合课堂配套练习题.doc
- 25上半年2期套题班-行政职业能力测验(八).docx
- 公考讲义-2025年1月时政汇总.pdf
- 2025年省考逻辑填空1000 高频实词积累+刷题早读课 讲义.pdf
- 25上半年2期套题班-行政职业能力测验(九).docx
- 2025四川事业编FB综合岗考试-综合能力测试讲义-主观题基础,案例分析题,公文写作及文章写作题.pdf
- 25上半年2期套题班-行政职业能力测验(五).docx
- 2025申论多省联考刷题课真题资料-2025国考执法课程.doc
- 2025申论多省联考刷题课真题资料-2024江西执法课程.doc
- 25上半年2期套题班-行政职业能力测验(十).docx
- 2025申论多省联考刷题课真题资料-2024福建县乡课程.doc
最近下载
- 2024年湖南株洲茶陵县自然资源局招聘8人历年高频考题难、易错点模拟试题(共500题)附带答案详解.docx
- 基于核心素养的体育教学改革与实践探讨教学研究课题报告.docx
- (完整版)小学一年级下册数学口算题卡及口算天天练精品汇集100以内和20以内加减.pdf
- 食品质量保证措施方案.docx
- 【IQVIA】医疗器械带量采购洞察:规则下、常态下的企业商业管理水平考量.pdf
- TDS-W3221智能温控仪说明书.pdf VIP
- 干式变压器安装使用说明书-中英文对照.pdf
- 新高考语文二轮复习晨读晚练60天(第4天)- 备战2024年新高考语文二轮复习晨读晚练60天(全国通.docx VIP
- 2024四川两弹一星干部学院第三批招聘10人笔试备考试题及答案解析.docx
- 智慧小区全面解决方案.pptx VIP
文档评论(0)