第四章置标语言工具.ppt

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4 信息组织 4.1 SGML 从信息组织的电子信息组织的发展来看,依发展的时间顺序介绍三种电子文件格式:标准通用标示语言(Standard Generalized Markup Language;简称SGML)、超文件标示语言(Hypertext Markup Language;简称HTML)与必威体育精装版崛起的可扩展标示语言(Extensible Markup Language,简称XML) 。 SGML是ISO在1986年所颁布的国际标准(ISO 8879),在电子图书馆相关计划中,目前有TEI(Text Encoding Initiative)、EAD(Encoded Archival Description)、CIMI(Consortium for the Interchange of Museum Information)、DIAP(Digital Image Access Project)与美国国会图书馆的American Memory Project等采用SGML作为文件格式。 HTML是SGML的一个应用,是一种用以创造超文件(hypertext)的简易数据格式,目前在全球信息网(World Wide Web;简称WWW或Web)获得普遍的采用,是写作网页(webpages)的标准语言;XML是全球信息网联盟(World Wide Web Consortium;简称W3C)在1996年底所提出的标准,1998年2月公布XML 1.0 Recommendation,相关标准目前仍在发展之中。这个新一代的标示语言被期许能具有SGML的弹性,但又不像SGML般复杂,并能如HTML般能在Web上传送。 一.什么是标示(markup) SGML、HTML、XML都是标示语言(Markup Language)。最早,标示是文件在排版时,用来指示文字如何编排的指令,包括控制字体的大小、字型的选择(如楷体、细明体等)、字形的处理(如粗体、斜体、加底线等)、页面的大小(如A4、B5等)、天地左右的留白宽度、标题、段落、脚注、表格…等,这些标示并不处理文件的内容,主要用来处理文件实际的呈现外观,这类的标示称为程序性标示(Procedural Markup)。大部分的电子出版或文字处理软件都使用专属性的程序性标示,也就是说这些系统都使用专属的句柄来执行文件的处理,如字体的加粗、放大…等 这些专属的句柄大都只能在特定平台的特定的系统或相关软件中执行,如果所使用的硬件或系统软件换了,这些标示过的文件往往必须进行重新标示的工作,这种数据转换所花费的代价通常相当的大;同样的,使用程序性标示的文件在交换时,文件交换的双方通常必须使用相同的系统。一般而言,程序性标示的作用都只针对单一文件,例如控制某一份文件以特定的格式输出,如果同一份文件内容希望以不同的呈现外观再利用,必须移除先前的标示,加入符合新的呈现外观的标示;或者将同样的文件内容复制一份,为新的呈现外观进行标示。 另一类的标示称为描述性标示(Descriptive Markup),也称为通用标示(Generic Markup或Generalized Markup),所描述的是文件的内容(content)或结构(structure),而不是文件的呈现外观。描述文件结构的方式是以标示指定结构中的元素(elements),以文章为例,其结构可能有标题、章、节、参考书目…等;以书信为例,结构可能有寄件人、收件人、书信内容…等。通用标示的基本概念是文件的内容必须和文件的呈现信息(即所谓的样式)分开,由于内容、结构与呈现信息分开,所以同一份文件内容可以有多种呈现方式,例如同一个档案可能以纸本、在线、CD-ROM与Web版本发行。 XML、SGML都是典型的通用标示语言,HTML就比较特殊了,HTML的标签集(tag set)中大部分是用来设定文件在Web上的呈现外观,少部分描述文件的结构(如:head, title, body)。由于HTML是SGML的一种应用,所以HTML并非程序性标示语言,而是以描述性标示的方式来控制文件的呈现外观;HTML的样式是内建的,并不像XML、SGML有分离的样式,所以HTML标示的作用与程序性标示类似是针对单一文件,并不像XML、SGML有较高的再利用弹性。 SGML SGML是ISO在1986年所订定的标准,编号是ISO 8879。SGML 是一种元语言(meta-language),元语言是一套可以用来定义其它更专门性的标示语言的通用规则,HTML就是由SGML所定义出来,专门使用在WWW上的标示语言。SGML主要应用在文字数据的交换,但也适用于其它的数据型态,SGML是很好的数据储存格式,适用于任何复杂的文件结构,但缺点是在网络传输(network de

文档评论(0)

awang118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档