地方文献古籍数字化工作剖析.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
地方文献古籍数字化工作剖析

地方文献古籍数字化工作剖析   摘 要:随着古籍文献数字化资源的开发与建设,地方文献古籍数字化的进程也在有序地开展,本文从地方文献古籍数字化的意义入手,通过列举本馆在数字化工作中遇到的问题,并提出了解决这些问题的对策和方法。   关键词:地方文献;古籍;数字化   地方文献古籍即地方古代书籍、文献,是综合反映一个地区历史进程中政治、经济、文化、教育、历史、地理、风土人情、人物传记、物产资源、名胜古迹等重要内容的文献资源,它是各地区民族历史文化的重要载体,各地区的历史文化和民族的精神有赖于它而传承、延续。   笔者所在的梧州市,是岭南古都,自建制以来,历汉、三国、魏晋南北朝,达700多年。梧州市图书馆馆藏的地方文献古籍以方志为主,如广西通志(清嘉庆六年刻本 )、苍梧县志(清同治十三年刻本)、临桂县志(清嘉庆七年刻本)等。这些旧方志的很多材料来自现实生活,会记载大量的人物传记,这部分人物在正史中多半是不收录或者记载不详细,因此旧方志对于了解梧州地区一些特殊人物的真实生活情况,帮助更全面的还原这些人物的各种信息具有不可替代的作用。   1 地方文献古籍数字化的意义   地方文献古籍是珍贵文化遗产,我们既要保护好珍贵的地方文献古籍,又要利用好地方文献古籍给我们的精神遗产。但是地方文献古籍往往由于保护不力,都会出现虫蛀、残缺、发霉等破损情况,很多馆藏单位本着保护文献的目的,都不提供对外借阅,这就产生了保护与利用不能共存的矛盾。而地方文献古籍数字化以后,这个矛盾就不存在了,因为数字化地方文献古籍是对原文献的整理后以计算机数字形式呈现,它将原文献的文化价值和文物价值分开来,既实现了地方文献古籍的数字化永久保存,有可以使研究人员、读者在不接触原文献的基础上进行阅读和研究。   2 地方文献古籍数字化概念   地方文献古籍数字化可以称为“计算机化”,分为两个步骤:一是古籍文献的数字图像化,一是古籍文字的数字编码化。通过电子扫描、数码照相等技术手段,可以将古籍的图文处理成用计算机能识别和处理的数据。数字编码化是通过多种手段以字符方式输人计算机,现在普遍做法是在古籍文图的数字图像化基础上采用OCR (光学字符自动识别)技术,再辅以人工校对。古籍数字化后,利用计算机可对古籍作进一步整理、研究,进而予以更充分的利用。   3 地方文献古籍数字化存在的主要问题   3.1 存在重复建设现象   地方文献古籍相对于一般古籍来说地域性十分明显,收藏单位基本上是本地区的相关单位,可是相同收藏也十分普遍,如本馆馆藏的苍梧县志(清同治十三年刻本),广西民族大学图书馆、广西壮族自治区图书馆、广西档案局、广西壮族自治区博物馆等单位也收藏有,如果各单位都进行数字化工程,很容易产生重复建设现象。   3.2 图像处理标准化问题   数字化工作第一个步骤是图像扫描或拍照,由于不同的项目和工作人员变动,在图像处理工作中会出现很多问题,例如由于设备的不同,拍照或者扫描的图片会出现很多种格式和不同的分辨率,导致数据文件延续性很差和文件十分混乱,没有一个同一的标准,会使得数字化成果无法达到我们数据库建设最终预期,直接关系着数字化成果的利用效率。   3.3 文字编码化中异形字问题   在地方文献古籍文字编码化过程中,大量异体字的存在是很麻烦的事,人常说“字无定量”,就是说因为汉字异体字多得无法估量。如广西永福县寿城石壁上有幅《百寿图》雕刻有百个寿字,除不同字体外,至少有三十种不同写法。地方文献古籍中复杂多变的异体字,在文字编码化过程中处理起来非常棘手,稍不注意,就会出错。其中常遇到的异形字问题主要有三种:   3.3.1 同字异写,例如“半”上的两点写为八,“流”字右上无一点,“户”字上部写成一撇(?簦┗蛞缓幔?酰┑取?   3.3.2 讹误异体字,即部分字长期被错误书写,渐渐发展成常见态势。这类字常见的如“?簟背闪恕?摹保弧斑_”往往少了一 横,变成“?Q”字;“淫”误写成“潘”等。   3.3.3 用字混乱现象,现今人们区分很清楚的形近字,古人却常常混用,常见的如“已一巳一己”、“戊一戌一 戍”等。   3.4 地方文献数字化人员缺乏和素质有待提高   目前地方文献数字化人员十分缺乏。如梧州市图书馆地方文献和古籍的整理工作都是辅导部人员兼职,所以进行地方文献数字化工作就会十分的缓慢,我们馆早在2007年已经购买了专业的冷光零边距扫描仪设备,但由于没有专职人员,数字化工作经常中断,将近10年的时间才完成少量的地方文献的扫描工作。而且由于不是专职,人员的专业知识得不到持续的学习和提高。   4 解决方法与对策   4.1 建立统一古籍数字化的标准规范   在国家没有建立古籍数字化标准规范的情况下,各馆之间要加强交流沟通,在进行数字化项

文档评论(0)

151****1926 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档