浅析P2P环境下的XML索引问题-XML技术.docxVIP

浅析P2P环境下的XML索引问题-XML技术.docx

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

?

?

浅析P2P环境下的XML索引问题

XML技术

?

?

论文导读::技术简介。索引概述。相信XML在P2P环境中的应用会越来越普遍。

论文关键词:XML技术,索引,P2P

?

一、XML技术简介

XML是指可扩展的标记语言,是互联网中表示结构化信息的一种标准文本格式。它虽然没有复杂的语法和包罗万象的数据定义,但却利用半结构化的数据表达,良好地实现了互联网中的数据交换。XML采用了一种用户自定义标签的构建方式,可很好地定义半结构化数据。随着XML技术的不断成熟,关系数据库数据与XML数据的相互转化、XML在关系数据库中的存储和提取、XML索引、XML查询及XML原生数据库都成为了极为热门的研究领域。

XML语言区别于其他语言的巨大优势还在于其对数据的表达。利用XML,纯文本文件可以用来共享数据。既然XML数据是以纯文本格式存储的,那么XML提供了一种与软件和硬件无关的共享数据方法。这样创建一个能够被不同的应用程序读取的数据文件就变得十分简单了。当今的计算机世界中,不同企业、不同部门中存在着许多不同的系统。要想在这些不同的平台、不同的数据库软件之间传输信息,不得不使用一些特殊的软件,非常之不便。而不同的显示界面,从工作站、个人微机、到手机,使这些信息的个性化显示也变得很困难。然而利用XML,各种不同的系统之间可以采用XML作为交流媒介。XML不但简单易读,而且可以标注各种文字、图像甚至二进制文件,只要有XML处理工具,就可以轻松地读取并利用这些数据,使得XML成为一种非常理想的网际语言。

二、XML索引概述

索引是提高查询速度的最重要的工具XML技术,由于I/O代价对于数据库操作的重要性,必然要通过DBMS在磁盘上组织数据记录文件来减少I/O代价。索引就是在磁盘上组织数据记录的一种数据结构,用于优化某类数据检索的操作。

XML文件中元素关系基于一种嵌套结构,XML文件被描述成一种节点被标记的树形模型,查询则是一种统一的表达方式,通过文件结构和节点取值来进行对文件的有哪些信誉好的足球投注网站。在大多数的XML查询语言中,XML文档结构都以线性路径或枝叶模式来表达,其中XML元素的取值成为选择谓词的一部分。XML文件是一种半结构化的数据表达,索引的作用就是将XML文档标签甚至内容映射成易于处理的表达方式。为了以清晰的方式阐明XML树形结构中数据彼此之间的关系,人们通常采用数据编码来实现。利用数字编码方式,可以方便地确定出一棵树中祖先与后裔之间的关系。

通过查询来解决对XML数据的有哪些信誉好的足球投注网站,索引的构建方式主要有两种,即结构索引和数字编码。数字编码模式则利用XML的节点位置进行相应地编码。目前大多数的数字编码模式都基于数遍历模式,节点之间的结构关系通过索引编码进行确认论文开题报告范例。

三、XML索引的优势

(一)维护顺序

对于XML文档中所包含的大规模数据记录,如果被频繁地修改,保存顺序的代价将会有很大的提高,不利于查询(即得到数据集合)。另外当查询的记录集很大,但只包含少量的符合条件的记录,那么效率也会非常低。采用索引方式,不但可以有效地保存数据集合,还可以在索引的同时对某类数据进行提取,从而达到隐私保护的目的。

(二)支持多限制查询

当查询具有多个限制条件时,通过多个索引的限制可以有效地帮助查询快速得到结果集合。避免了重复扫描整个文件来得到记录集。支持一次使用两种不同方法对数据行进行排序。同在关系数据库中相同,由于涉及多表连接查询,就会使得索引的优势更加明显地发挥。未加索引时,我们必须通过多表连接的所有可能数据组合来确定是否满足条件。当多表的数据项数目可观时,就造成了大量的运行时间。引入索引后,只需顺序查找第一个表中数据项,针对该锁定数据项使用其他表上的索引,与其进行关联定位。这样,除了第一个以外的其他表,我们不必遍历其所有的数据项,大大减少了运行时间。以三个1000记录的查询为例,通过加入索引,理论上采用这种方式运行上面的查询会快一百万倍。

(三)保存XML文档结构

由于XML具有半结构化数据的特点,在XML中可以包含整个文档的结构。因此在建立XML索引的同时可以利用索引保存结构信息XML技术,例如twig结构索引等。将索引和数据相结合,有效地提高了XML文档的查询效率,使得在针对文档进行的查询中可以采取更多的方法和语法。

四、XML索引的缺点

(一)插入和劣势

索引加快了检索的速度,但是减慢了插入和删除的速度,同时还减慢了更新被索引的数据列中的值的速度。也就是说,索引减慢了大多数涉及写操作的速度。发生这种现象的原因在于插入一项数据的时候不但需要写入标签项,还需要改变所有标签或数据的索引。文档所包含的索引项越多,需要做出的修改就越多,平均性能的降低程度也就越大。

(二)磁盘空间

建立索引是在文件的基础上重新组织数据结构的方法,索引会花费磁盘空间,

文档评论(0)

黄锦文 + 关注
实名认证
文档贡献者

美女

1亿VIP精品文档

相关文档