- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
四川省档案资料数字化标准本标准根据国家档案局《电子文件归档与管理
四川省档案资料数字化标准
本标准根据国家档案局《电子文件归档与管理规范》、《纸质档案数字化技术规范》制定,适用于四川省各级档案馆(室)的数字化工作,其它单位可参照执行。
?
第一章? 纸质档案数字化标准
?
1 基本术语解释
1.1? 数字化? 指用计算机技术将模拟图像转换为数字图像的处理过程。
1.2? 纸质档案数字化? 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。
1.3? 数字图像? 表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。
1.4? 连续色调静态图像? 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
1.5? 失真度? 对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原件色彩、几何、压缩算法等差值。
1.6? 可懂度? 表示数字图像向人或机器提供信息的能力。
1.7? 图像压缩? 清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。
1.8? 分辨率? 指单位长度内图像包含的点数或像素数。
1.9? TIFF? 标记图像文件格式。一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。因为它存储的图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑白档案的复制储存。
1.10? JPEG? 联合照片专家组。一种丢失少量信息的压缩格式,尤其适用于屏幕和打印显示,支持所有主要的计算机平台和Web浏览器。JPEG格式文件小,影像质量多数情况下均可接受。考虑储存空间及传输效率,原件为彩色的档案可选此格式复制储存。
1.11? 灰度值? 指进行灰度扫描时把图像由纯黑到纯白整个色彩区域进行划分的级数,编辑图像时一般都使用到8位,即256级灰度。
1.12? 黑白二值图像? 是与彩色及灰度相对应的一种模式,黑白图在表示图像时只区分黑白二值,他把其它色彩根据其特性转换为黑白两种,因此形成只有两种颜色的图像。
1.13? LZW压缩? LZW压缩是一种比较复杂的压缩算法,其压缩效率也比较高。它的基本原理为:LZW把每一个第一次出现的字符串用一个数值来编码,在还原程序中再将这个数值还成原来的字符串。例如:用数值0x100代替字符串“abccddeee”,每当出现该字符串时,都用0x100代替,这样就起到了压缩的作用。LZW是无损压缩,因此它不会对图像质量造成损失。
2 数字化基本流程
纸质档案数字化的基本流程主要包括案卷整理、目录建库、批量扫描、数据处理、信息存储、检索利用等工序。
2.1 案卷整理
??? 对需要扫描的案卷进行适当整理,做出标识。
2.2 目录建库
??? 为数字化的档案检索而建立必要的目录数据库。
2.3 批量扫描
??? 按照档案数字化具体任务的整体安排按计划分批次进行扫描。
2.4 数据处理
2.4.1 对扫描图像进行校对,确保图像完整无误,并视需要对有问题的扫描图像进行纠偏、去污、拼接等技术处理。
2.4.2 对裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件,以及数据的挂接、检验、上载、质量检查和备份。
2.5 信息存储
??? 根据不同的扫描图像选择适当数据格式、编码方式和存储介质对信息进行保存。
2.6 检索利用????
??? 按用户需求提供检索利用。
3 案卷整理
??? 在批量扫描之前,按下述步骤对案卷进行整理,确保档案数字化质量。3.1 分件
3.1.1 把同一案卷中的扫描和非扫描分开。
3.1.2 在扫描件中将大图、照片插入指示页,便于扫描工序批量扫描,实际图像放在图像处理时进行重扫,替换指示页。
3.1.3 填写《数据加工过程处理单》(见附录A),对需要特殊处理的页,标识清楚。
3.2 分页
??? 对批量扫描前的档案进行页号、件号的标注。如在标注中与原档案中的件数、页号不一致,应以此为准。
3.3 拆卷
??? 去除档案中原来的装订物,以便后续扫描工作的进行。
3.4 装卷
??? 按档案保管要求恢复原装订。
4 建目录库
4.1 目录著录
??? 根据DA/T18确定档案著录项,并进行著录。
4.2 数据格式选择
??? 所选定的数据格式通用,应能直接或间接与DBF文件格式或通过XML文档进行数据交换。
4.3 目录输入
??? 将著录好的目录输入计算机内,建立机读目录数据库。
5 批量扫描
5.1 扫描方式
??? 纸质档案扫描可采用黑白二值图像和连续色调图像两种方式。
5.1.1 页面为单色文字的纸质档案,宜采用黑白二值图像扫描;页面为多色文字图像
文档评论(0)