元数据功能及在人文学科应用的论文.ppt

元数据功能及在人文学科应用的论文.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
元数据功能及在人文学科应用的论文.ppt

历史研究所 刘洪波 一、元数据的过去及现状 定义 格式 MARC Dublic Core 一些人的看法 元数据的定义 我们所说的“元数据”,英文作Metadata。目前在国内有多种译法,大陆一般译作“元数据”。香港和台湾则译法较多,台湾有人译作“预设资料” 、“诠释资料”、“元资料”,也有人译作“后设资料”。 关于这一名称,西方学者大多定义为:Data about Data,即关于数据的数据。它是用于描述信息资源的高度结构化数据。 数据是手提箱,而元数据是它上面的姓名标牌;数据是文件夹,而元数据是夹子的标签;数据是书的内容,元数据是书脊上的杜威十进制数码。 元数据的格式 网络资源:Dublin Core、CDF、Web Collections 文献资料:MARC,Dublic Core 人文科学:TEI Header 社会科学数据集:ICPSR SGML Codebook 博物馆与艺术作品:CIMI、CDWA、RLG 政府信息:GILS MARC及Dublic(DC) MARC于1965年由美国会图书馆一个研究小组制定,后来不断完善,成为图书馆数字化检索的重要格式。1991年,我国有关部门在UNIMARC基础上加上我们所需的特定字段,编制了《中国机读目录通讯格式》(CNMARC),此后多次修订 Dublic Core 最初于1995年制定,从时间上看要比MARC晚,在技术上要先进 Dublic Core (DC) 由来:在1995年联合召开了第一次都柏林(都柏林为美国俄亥俄州的一个城市)核心集会议。来自图书馆、计算机及有关领域的专家达成一致意见,创建了只包含能够描述电子文献基本特征的Dublin Core 从1995年开始,专家小组共召开了13次会议,讨论与核心集相关的各种问题。2004年10月11-14日,我国上海图书馆主办了第12次会议。最近一次会议于2005年9月12 -15日在西班牙首都马德里召开,来自33个国家和地区共计214名专家学者出席了会议。 Dublic Core的原则 简单性原则”。定义一个能得到最广泛应用、被全球所理解和接受的最小元素集,并能作为特殊用户详细描述需求的一个核心集。 “易用性原则”。能方便作者和信息提供者描述自己的文档,而不给他们增加太多的负担,并能方便地实现资源发现工具之间的互操作性。 “内在性(intrinsicality)原则”。指DC 元数据以揭示描述对象自身的内容属性为主,外部属性为辅。 “可扩展性原则”。希望DC 成为一个“核心”元素集合而可以通过各种方式扩展为适应各领域资源描述需要的元数据方案。 “句法独立(syntax independence)原则”。指DC 元数据的元素可以以多种方式编码,应用于各类技术平台中。DC 只规定元素的基本语义。 “可选择性”。指DC 元素集合中的任何元素都是可选的。 “可重复性”。指DC 元素集合中的任何元素都是可重复的。 “可修改性”。指在具体应用中可以对DC 元素集中的任何元素进行进一步“修饰”或“限定”,但不能扩大或改变元素的基本语义。 元素:标题、作者、主题、出版者、描述、其他参与者、日期、类型、格式、标识、关系、资料来源、语言、内容范围、版权15个元素组成 都柏林核心集目前已经扩展成一个世界性元数据标准,有五个国家(澳大利亚、芬兰、丹麦、英国、美国)把它确定为国家标准,各类推荐方案被翻译成33种语言。 当前对都柏林数据集的看法 由于Google等检索工具出现,一些人甚至断言,元数据特别是DC,在还没有成为通用标准以前,已经寿终正寝了。 Google等通用检索工具,查全查准两方面都还有很多问题。 而在这两个方面,使用元数据的专用信息库则会充分发挥自己的优势。 在今后的一段时间内,元数据不会因为信息技术的进步而失去其存在的价值。这是我们断续研究和使用元数据的最主要的动力。 二、元数据的功能及我国元数据应用状况 1.元数据的功能 2.元数据在我国的应用 在某些方面,例如元数据有利于管理信息和检索信息,取得了大体一致的意见,但对元数据功能的认识还是有差异的,这种认识上的差异则导致元数据设计时产生不同的结果。 大多数人仍未认识到元数据在信息库建设中的重要作用 按照统一的标准建设资料库,合理有序地组织信息。 确立元数据标准在大型的、多学科、多单位合作的项目中尤为重要。既使简单的、信息内容较少、参加人员不多的信息库,在建设之初也要先确定元数据标准。 可以通过对相同的元数据元素进行比较,来获取必威体育精装版的资料版本。 在元数据元素中,通常都有各信息库的版本资料,通过对相同元数据元素进行比较,可以在访问不同数据源时,决定获取哪一版本的资料。 利于数据维护、转换和扩展 在信息库运行过程中,总会出现这样那样的问题,这就要求精心管

文档评论(0)

tk2469tk + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档