- 1、本文档共24页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第11章 半结构化数据模型 11.1 半机构化数据 11.2 XML Page * 11.1 半结构化数据 半结构化数据SSD 它是一种适于数据库集成的数据模型,即适于描述包含在两个或多个数据库(这些数据库含有不同模式的相似数据)中的数据; 它是一种标记服务的基础模型,用于Web上共享信息。 为何需要半结构化数据模型 可以看成是E/R模型和OO模型的混合 类/联系;类/关系 关系模型成功的一大原因在于它简化了系统的高效实现,而SSD模型的关注原因是灵活性 SSD是无模式的。本身就指明了其模式,且该模式会不断变化 * 半结构化数据表示 SSD的数据库是节点的集合,每个节点都是一个叶子节点或者一个内部节点; 根节点:没有进入的弧,它代表整个数据库,每个节点都从根可达; 叶子节点:与数据相关,数据的类型可以是任意原子类型,如数字或字符串; 内部节点:至少有一条向外的弧,每条弧都有一个标签,指明弧开始处的节点与弧末端的节点之间的关系。 Page * 例11.1 关于电影与影星的半结构化数据库 Page * SSD表示 Root节点:有出无入 每个节点都可从root到达,但这个图未必是一棵树 其中的cf/mh/sw是三个逻辑节点,即只是为了表示和引用方便,本身不属于数据库; 从节点N出发到达节点M的弧上的标签L可担任下面两个角色之一: N表示的是一个对象或实体,而M表示N的一个属性,那么L表示该属性的名字; N和M都是对象或实体,L就是从N到M的一个联系的名字。 例11.2。注意cf到name/address的弧标签是属性名;address到street/city的弧标签是域名;cf到sw的弧标签是联系名 Page * 信息集成与半结构化数据 SSD模型是自描述的,模式与数据附着在一起 每个非根节点的入弧的标签表示该节点在弧起点节点中的角色(属性/域/联系等) 将SSD的特点应用于信息集成 同时访问多个数据库,例如合并多个库中的数据集,如果这些数据库的模式一致,则元组直接合并; 信息集成中需要解决数据的异构性 数据模式:如图11-1中影星的地址 数据模型:关系模型、面向对象 如果模式不同,且合并要考虑遗留数据库问题 数据库一般是持续运行的,不允许因为要复制数据到另一个数据库而将其关闭(即使可以得出从某一模式到另一模式的最有效途径) Page * 信息集成与半结构化数据 异构数据集成的解决方案:外加接口 接口支持SSD,接口导入分布库数据源的数据,转换为作为中间数据的SSD并存储; 数据库中的源数据通过wrapper/adapter组件的翻译功能进行转换。图11-2 另一种解决方案 接口只负责将查询传递给数据源,并返回在数据源中相应模式的引用(接口最后只保留一些指针) Page * 例11.3 例子描述中两个影星数据来自不同结构(模式)的数据库。要进行跨库查询则有两种可能 通过第一种接口将数据库物理合并为SSD形式再进行查询 将查询分别传递给两个库,各自完成具体查询工作后向接口返回引用指针。后继应用需要具体结果时可根据引用指针取到值 习题11.1.5。UML模型和SSD模型的本质区别? SSD中的节点表示实体,UML中的节点表示实体集 Page * 11.2 XML 什么是XML(Extensible Markup Language)? XML是一种元标记语言,可以定义特定领域内的标记语言的语法结构。 XML与HTML不同在于可扩展性,XML不象HTML那样,提供了一组事先定义好了的标记,而是提供了一个定义标记的标准,利用这个标准,用户可以根据实际需要定义自己的标记。此外更重要的是,XML描述的是结构和语义而不是格式。 介绍XML的目的 XML在HTML的数据内容表示基础上,进一步描述了文档内部信息之间的层次关系 XML的基本原理与前一节中的SSD相同,特别是XML中标签的功能与SSD中的弧功能相同 这些相似性特点使得XML成为SSD模型的一种典型实现 Page * 语义标签 用尖括号括起来的文本,往往成对出现,称为开始标签和结束标签; FOO…/FOO 标签之间可以出现包含文本和嵌套标签,一对匹配标签和出现在它们之间的一切内容称为元素; FOOhello!/FOO addresscityNewYork/city/address 非成对标签不能包含任何元素或文本,但可以有属性。 FOO/ Page * 有模式和无模式的XML 格式规范的(Well-Formed) 格式正确的XML文档遵守XML语法,但没有文档类型定义DTD(Document Type Definition)或模式定义。 合法的(Valid) 包括一个DTD(文档定义类型),它定义
您可能关注的文档
- 数据库技术复习2014解读.ppt
- 数据库期末复习答案解读.doc
- 数据库实验报告解读.doc
- 数据库实验指导书解读.doc
- 数据库系统概论11解读.ppt
- 数据库系统概论解读.ppt
- 数据库系统实现习题全解读.docx
- 数据库系统原理-第二章关系数据模型解读.ppt
- 数据库系统原理复习解读.ppt
- 数据库学习入门数据库基础解读.docx
- 2024-2030年中国加气块界面剂行业市场全景调研及投资价值评估咨询报告.docx
- 2024-2030年中国净水处理机行业市场发展现状及发展趋势与投资前景研究报告.docx
- 2024-2030年中国冻干制剂行业发展趋势及竞争态势分析报告.docx
- 2024-2030年中国冷饮市场经营效益分析与未来销售渠道趋势研究报告.docx
- 2024-2030年中国冷轧薄板行业市场发展分析及发展趋势与投资研究报告.docx
- 2024-2030年中国凝胶柱凝集试验系统行业运行形势与前景趋势预测研究报告.docx
- 2024-2030年中国凉茶市场运行态势与销售渠道分析研究报告.docx
- 2024-2030年中国冰淇淋冷饮餐车行业盈利模式及竞争态势分析报告.docx
- 2024-2030年中国冰雪产业运营模式及发展重点规划探析研究报告.docx
- 2024-2030年中国功能糖行业市场发展分析及发展前景与投资策略研究报告.docx
文档评论(0)