- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
图书文献数字化实施方案
图书数字化加工流程主要包括
(1)图书遴选,制作图书数字化加工图书详细信息表;
(2)采购人审核图书详细信息表,最终确定图书清单;
(3)图书扫描、制作合格的成品图像;
(4)OCR识别、TXT制作、PDF制作、元数据著录;
(5)第三方质检;
(6)成果提交。
一、图书遴选
选取具有鲜明地域特色、较高文献和历史价值的1949年以来出版的方志、
地方文史资料、珍贵少数民族语言资料等地方图书资源进行数字化加工。
推广工程数字资源联合建设地方文献数字化项目文献详细信息表
文献名称责任者出版社出版时间ISBN页数尺寸分类版权状态备注
注:此表为EXCEL表头,提交时请将文献元数据基本信息填写完整,提交EXCEL
表格。备注项填写文献的状态信息,如是否缺页等。
二、书单审核
我单位提交国家图书馆项目负责组进行书目审核(市馆提交给省馆初审,省
馆初审后,连同初审意见一同提交给国家图书馆审核,由国家图书馆出具审核意
见)。
三、图书扫描
1、图书内容的分类
中图分类:描述资源主题内容的中图分类法类号。依照CLC(《中国图书馆
分类法》第五版)进行标引。
2、命名规则
(1)加工编号(book_id)
文献数字化加工过程中一册文献的唯一标识,它由11位数字和1位下划线
组成。
文献基本资料类型(1位)、文献语种(1位)、任务年(2位)、机构代码(4
位)、下划线(1位)、单位内部流水号(3位)。
本规则针对地方图书的文献基本资料类型为(0:图书),文献语种为(1:
中文),任务年为公元年后两位数字(19年项目统一为19),机构代码见《图书
馆机构代码表》(2019),单位内部流水号由各单位自行分配,从1开始,不足
3位以0补齐。
例001
(2)图像文件名
文件后缀名为小写字母
1)前封(含封一、封二)
扫描文件名为Axxxxx_00,其中xxxxx为5位数字,按原书顺序依次排序。
2)前附页
目录页之前的前附页扫描文件名为Bxxxxx_00,其中xxxxx为5位数字,
按原书顺序依次排序。
目录页之后的前附页扫描文件名为Dxxxxx_00,其中xxxxx为5位数字,
按原书顺序依次排序。
3)目录页
扫描文件名为Cxxxxx_00,其中xxxxx为5位数字,按原书顺序依次排序。
4)正文
有页码的正文扫描文件名为Txxxxx_00,其中xxxxx为5位数字,与原书页号
一致,按原书顺序依次排序。当存在大幅图像需分区扫描时其文件命名为
Txxxxx_00zz,其中zz为数字,表示扫描图像分区,按扫描顺序排序,对应的发
布服务级进行合并后命名为Txxxxx_00。例如:该图在原书的第28页,该图分
成4个画幅,则4个画幅的扫描文件名分别为T00028_0001.tif、
T00028_0002.tif、T00028_0003.tif、T00028_0004.tif,拼接后的发布级图像
文件名为T00028_00.pdf。
正文中插页扫描文件名为Txxxxx_yy,其中xxxxx为5位数字,表示插页的
前一页顺序号,yy为数字,表示插页,并按原书顺序依次排序。当插页中存在大
幅图像需分区扫描时其命名为Txxxxx_yyzz,yy为数字,表示插页;zz为数字,
表示扫描图像分区,按扫描顺序排序,对应的发布服务级图像进行合并后命名为
Txxxxx_yy。例如:一张图夹在20页、21页之间,且该图分成4个画幅扫描,
则4个画幅的扫描文件名分别为T00020_0101.tif、T00020_0102.tif、
T00020
文档评论(0)