- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Web超树模型与数据的重构
8 计算机应用研究 1999丘
Web超树模型与数据的重构
弋 j
(广东商学院计算机中I心 广州 510320)
摘 要 welb的广泛应用已导致 了几个新的数据管理 1口1题:如从w曲页中提取教据 查询结构化文档
和半结构化数据 。其关键是要解决.数据重构 的问题.本文提出一种welb页的超树模型及welb的有 向圆
关键词基w葚出URL懿据攫型超文本觎 ;柑时糙 -/
1 引言 1.3 web不是传统数据库l_‘
在过去的二十年内,计算机和通信工具每年以迅 与传统的关系数据库系统相 比较.www缺乏统
猛速度增长。与此同时.计算机通讯网络也以惊人的 一 的结构和数据模型,缺乏并发控制和事务处理机
速度发展 ,将世界 的各个角落连接成一个 巨大 的 制,缺乏完整性约束机制等RDBMS中优 良的特性 ,
www信息网 www网连通各个国家数 以万计的网 因此 .我们无法将web看作标准数据库而直接应用SQL
络服务器、数以千万计 的网络用户和无数的网络信 息 结构化查询语言来表达我们 的查询要求 此外.一种
资源 .为信息的生产 、传输和利用开辟了一个全新 的 完善的Web查询方法不能单纯地基于 内容 ,还应
空间。 基于 “结构 ,以实现数据的包装 、数据 的转换和数
l-1 复杂查询 的需要 据 的重构操作。
由于www网 中信 息的浩瀚及 其分布式异构特 2 web数据模型
征,如何方便、灵活、快捷地从中有哪些信誉好的足球投注网站 出所需要 的信 www网由许许多多的Web站点所构成,每卟welb
息便是一个根关键 的问题 目前,对Web文档信息搜 站点又包含有许多的Web页(含Web站点主页).每个
索基本上是采用以下方法 ;其一是浏览(navigation), Web页可通过超文本描述语言HTML进行格式和链路
即从一初始URL出发一级一级地进行浏览:其二是关 等方面的设计 为便于重构.我们应当从尽可能小的
键词查询(Qua,),即通过诸 如 血oo、Altavista这 一 粒度着手(即从HTML文档的内部结构着手),对Web
类的索引服务器进行有哪些信誉好的足球投注网站。这类服务器并没有保证对 加以模型化。
每一个文档建立起索引,基本上只提供对预先计算过 21 基干超槲的数据模型
的数据进行寻址。这一限制使得对复杂 的查询操作难 超树 超树是有序树.其结点之间有两类弧:内
于实现。如要查询 “不古超链的文档 ”.便无法表述 。 弧和外弧 内弧代表结构化对象,外弧代表对象间的
设计一种功能类似于传统数据库的查询语言便根自然 引用(如超链接).每一条弧对应一条记录,记录中各
地提出来了 属性的原子数据类型为串。图1昕示便:目群 自 棵超树。
1,2 web数据管理
作为一个超文本系统,Web的广泛使用 已导致 了
几个新的数据管理问题 主要反映在以下三个方面:
1)Web查询 :如何浏览Web以找到具有某些特征要求
的数据,应能处理结构化文档、半结构化数据及对图
的查询 2)Web数据仓库 :从Web页中提取数据t并
将其集 中到一个数据库中进行数据集成。3)Web站点
重构 要对Web站点进行重构 .必须能够探索 出Web
页面的内部结构 若要让查询语言能够表达重构要
求,则不仅要能够处理文档的结构 ,还应提供一种能
够生成文档 间随意链接 的机制 好 的方法应 当是动态
的.即通过查询本身的能力来捕捉We
文档评论(0)