网站大量收购闲置独家精品文档,联系QQ:2885784924

《数据采集技术》课件——XPath 解析库.pptxVIP

《数据采集技术》课件——XPath 解析库.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

XPath解析库

Contents知识目标掌握XPath使用方法技能目标提高数据采集和处理能力素养目标培养良好的信息素养和道德意识

XPath简介XPath(XMLPath)是一种查询语言也称为XML路径语言,功能:XMLHTML树状结构中寻找结点确定XML文档中某部分位置。

XPath简介XPath使用路径表达式选取:XPath(XMLPath)是一种查询语言中的节点或者节点集XML文档这些路径表达式代表着从一个节点到另一个或者一组节点的顺序,并以“/”字符进行分隔。

XPath简介XML文档中的节点例子:示例1?xmlversion=1.0encoding=UTF-8?bookstorebooktitlelang=en毛泽东选集/titleprice29.99/price/bookbooktitlelang=enLearningXML/titleprice39.95/price/book/bookstoreXMLbookstore(文档节点)price29.99/price(元素节点)lang=en(属性节点)路径表达式:/bookstore/book/priceXML文档被作为节点树来对待。树的根被称为文档节点或者根节点。

XPath简介节点是通过沿着路径来选取的。下面列出了常用的路径表达式:XPath使用路径表达式在XML文档中选取节点表达式说明nodename选取nodename节点的所有子节点/从当前节点选取直接子节点//从当前节点选取子孙节点.选取当前节点..选取当前节点的父节点@选取属性父节点表示当前节点的上一层节点,子节点表示当前节点的下一层节点。子孙节点表示当前节点的所有下层节点。说明

XPath简介示例2?xmlversion=1.0encoding=UTF-8?bookstorebooktitlelang=enHarryPotter/titleprice29.99/price/bookbooktitlelang=enLearningXML/titleprice39.95/price/book/bookstoreXML路径表达式结果bookstore选取bookstore元素的所有子节点。/bookstore选取根元素bookstore。注释:假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径!bookstore/book选取属于bookstore的子元素的所有book元素。//book选取所有book子元素,而不管它们在文档中的位置。bookstore//book选择属于bookstore元素的后代的所有book元素,而不管它们位于bookstore之下的什么位置。//@lang选取名为lang的所有属性。列出一些路径表达式以及表达式的结果:

谓语(Predicates)谓语用来查找某个特定的节点或者包含某个指定的值的节点。谓语被嵌在方括号中。

谓语(Predicates)路径表达式结果/bookstore/book[1]选取属于bookstore子元素的第一个book元素。/bookstore/book[last()]选取属于bookstore子元素的最后一个book元素。/bookstore/book[last()-1]选取属于bookstore子元素的倒数第二个book元素。/bookstore/book[position()3]选取最前面的两个属于bookstore元素的子元素的book元素。//title[@lang]选取所有拥有名为lang的属性的title元素。//title[@lang=eng]选取所有title元素,且这些元素拥有值为eng的lang属性。/bookstore/book[price35.00]选取bookstore元素的所有book元素,且其中的price元素的值须大于35.00。/bookstore/book[price35.00]//title选取bookstore元素中的book元素的所有title元素,且其中的price元素的值须大于35.00。列出带有谓语的一些路径表达式,以及表达式的结果:

选取未知节点XPath通配符可用来选取未知的XML元素通配符描述*匹配任何元素节点@*匹配任何属性节点node()匹配任何类型的节点列出一些路径表达式,以及这些表达式的结果:路径表达式结果/bookstore/*选取bookstore元素的所有子元素//*选取文档中的所有元素//title[@*]选取所有带有属性的title元素

选取若干路径通过在路径表达式中使用|运算符,可以选取若干个路径。列出一些路径表达式,以及这些表达式的结果:路径表达式结果/

文档评论(0)

青柠职教 + 关注
实名认证
服务提供商

从业10年,专注职业教育专业建设,实训室建设等。

1亿VIP精品文档

相关文档