网站大量收购独家精品文档,联系QQ:2885784924

博奧汉通图书馆数字化加工方案.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博奧汉通图书馆数字化加工方案

数字图书馆文献资源建设 图书期刊数字化解决方案 北京博奥汉通科技有限公司 目 录 —————————————————— 前 言 - 2 - 方案概述 - 2 - 图书数字化解决方案 - 3 - 图书数字化的工序 - 3 - 图书数字化的种类 - 4 - 第一类 全文图像化,有简单的目录索引 - 4 - 第二类 全文文本化,可全文检索 - 4 - 第三类 全文图像文本化,可全文检索 - 5 - 第四类 基于原版原样的,可全文检索 - 5 - 四种类型比较 - 6 - 我们在图书数字化方面的优势 - 7 - 规模化、流水线式的数字化加工 - 7 - 成熟的软件产品 - 7 - 优秀的加工团队 - 9 - 低廉的价格 - 9 - 完善的服务 - 10 - 与传统图书数字化的比较 - 10 - 正确率 - 11 - 加工速度 - 11 - 单位价格 - 11 - 图书数字化的过程 - 12 - 公司简介 - 13 - 联系方式 - 15 - 前 言 —————————————————— 随着全国文化信息资源共享工程与中国数字图书馆工程的起动,信息化已成为国际潮流,信息资源建设成为当务之急。信息资源建设的重点是电子文献、各类数据库、网络资源、电子杂志、电子图书等新型数字化信息资源的建设。在数字化信息资源建设中,很大的一个需求是将现有的纸介质印刷品数字化,使之成为能够用计算机阅读、理解、查询、检索的电子文件,最终将其应用于数据库存储,或通过CD-ROM、Internet网进行出版,或上传数字图书馆供用户使用。 以传统纸张为载体的保存方式,占据了大量的空间,需要特殊的环境,而且不方便查询,随着时间的推移,还面临着腐蚀、老化等问题。而将纸介质文件信息进行电子化处理,保存到光盘上,具有存储、管理、共享等功能,还可以减少文件库房占地,节省保管设备和人员方面开支,又方便统计和进行远程查询。 因此,将图书、期刊、报纸等资料通过扫描仪,扫描成图像文件,再通过OCR识别成文字,建立目录和全文索引,制作成电子文件,已是当务之急。 方案概述 —————————————————— 我公司和多家大专院校的图书馆有过多次成功的合作,并成为CADAL(高等学校中英文图书数字化国际合作项目)、CALIS(中国高等教育文献保障系统)的数字资源建设服务商之一。在此基础上,我们充分理解图书数字化对大学图书馆建设的重要意义,同时我们也非常希望能与贵馆在信息化建设方面建立长期的合作关系。 本次与贵馆洽谈合作,拟在以博奥汉通人多年来在图书、报纸、期刊、杂志和档案方面专业的数字化服务与实施经验,为客户提供高效、高质量的信息资源数字化服务奠定了坚实的基础。 图书数字化解决方案 —————————————————— 图书数字化的工序 图书拆分→图像扫描→图像处理→文字识别→横向校对→纵向校对→对比校→索引制作→索引质检→成品验收→图书装订还原 1. 图书拆分 为了方便扫描加工,对可以拆的图书进行拆分扫描,加工完后再进行图书还原。其流程为:图书封皮与书脊分离,将脱离封皮的图书书脊用电动切纸机切去胶块部份,不同情况按不同尺寸精度切开。 2.图像扫描 扫描组主要负责将纸质性的图书扫描转为电子版的图像。在过程当中保证没有少扫漏扫现象。 3.图像处理 修图组是对扫描完的电子图像进行去污、校正等;同时修图组还进行质检图像模糊、原稿残缺、补扫、漏扫、图片不完整、多图重叠等图像问题。 4.识别与校对 用专业的英文识别软件将图像进行标注并识别其文本,然后进行人工一、二、三校,以保障数据的质量达到出版水平。 文字识别:差错率千分之五 横向校对:差错率万分之五 纵向校对:差错率万分之三 对 比 校:差错率万分之一 5.索引制作: 按照索引项目利用所提供的软件进行标注或人工标引。 6.索引质检: 检查索引的文字正确性与索引的字段标识。 7.成品验收: 对图像、文本与索引进行全面的质检,合格后提交成品。 8.装书还原: 成品入库后,就可以进行图书还原工作了,把要还原的图书用平台订书机和电动打穿装订机将书的内容装订好,然后用胶订机把书粘好,还原为原书。 图书数字化的种类 图书数字化根据检索和利用需求,大概分为以下几个种类: 第一类 全文图像化,有简单的目录索引 这种类型的图书数字化,仅仅是将纸质的资料利用扫描仪扫描成图像文件,并进行简单的编目,提供目录索引,而不做文字的识别。 其流程如下: 这种电子资料的好处在于投资小,每单位的价格最便宜;其缺点是没有全文检索功能,只能为读者提供简单的索引查询,图像文件较大导致浏览速度较慢。 第二类 全文文本化,可全文检索 这种类型的图书数字化,全部利用人工录入,建立全文文本化的电子资料,可以提供全文检索。 其流程如下: 其优点是占用存储空间较小,可实现全文检索,浏览传

文档评论(0)

zilaiye + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档