- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
XPath和lxml
详解Xpath和lxml库------- 吕姣目录1 什么是Xpath2 Xpath的基本语法3 lxml库Xpath简介XPath是W3C定义的语言和正式的W3C推荐的语言,W3C拥有XML Path Language (XPath) Version 1.0规范。XPath诞生于1999年,作为对XSLT和XPointer语言的补充,但近来已成为流行的独立语言,因为单个XPath表达式可用于替代多行DOM API代码。Xpath是一门在XML文档中查找信息的语言。Xpath用于在XML文档中通过元素和属性进行导航。什么是Xpath? 1.Xpath使用路径表达式在XML文档中进行导航 2.Xpath包含一个标准函数库 3.Xpath是XSLT(Extensible Stylesheet Language Transformations)中的重要元素 4.Xpath是一个W3C标准Xpath简介为什么要使用Xpath? 为了在匹配XML文档结构时能够准确地找到某一个节点元素。可以把XPath比作文件管理路径,通过文件管理路径,可以按照一定的规则查找到所需要的文件;同样,依据XPath所制定的规则,也可以很方便地找到XML结构文档树中的任何一个节点,显然这对XSLT来说是一个最最基本的功能。Xpath基本语法—Xpath基本术语文档节点?xml version=1.0 encoding=ISO-8859-1? bookstore book title lang=enHarry Potter/title authorJ K. Rowling/author year2005/year price29.99/price /book /bookstore元素节点属性节点在Xpath中有七种类型的节点:元素、属性、文本、命名空间、处理命令、注释以及文档节点(根节点)。节点(Node) 看一下下面的xml文件Xpath基本语法—Xpath节点基本值Harry Potter?xml version=1.0 encoding=ISO-8859-1? bookstore book title lang=enHarry Potter/title authorJ K. Rowling/author year2005/year price29.99/price /book /bookstoreBookstore是book的父节点,,book元素是titleauthor year price的父节点,每个元素都有一个父title、author、year 以及 price 元素都是 book 元素的子title 元素的先辈是 book 元素和 bookstore 元素bookstore 的后代是 book、title、author、year 以及 price 元素基本值(Atomic value) 基本值就是无父或者无子的节点。项目(Item) 项目是基本值或者节点节点关系:父(Parenet)子(Children)同胞(Sibling)先辈(Ancestor)后代(Descendant) Xpath选取节点表达式描述nodename选取此节点的所有子节点/从跟节点选取//从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。.选取当前节点..选取当前节点的父节点@选取属性XPath中对元素和属性的匹配—--定位节点每个XML文档都可看成是一棵树,该树与计算机中的树形文件夹非常类似,XPath使用以斜线分隔的子元素名的列表来描述某个XML文档的路径所匹配的元素。 /book/title选取book下的所有的title元素bookstore选取bookstore元素的所有子节点//book选取所有book子元素,不管他们在文档中的位置//@lang 选取名为lang的所有属性bookstore//book 选取属于bookstore元素的后代的所有book元 素,而不管它们位于bookstore之下的什么位置.//book[@lang=‘en’] 选取当前节点下的所有book元素属性为 lang=‘en’的节点 XPath中对元素和属性的匹配—--使用谓语谓语(Predicates) 谓语用来查找某个特定的节点或者包含某个指定的值的节点。使用谓语的一些表达式:/bookstore/book[1] 选取bookstore子元素的第一个book节点/bookstore/book[price35.00] 选取bookstore元素的所 有book元素,且price35.00/bookstore/book[price35.00]/title 选取 bookstore 元素中的 book 元素的所有 title 元素,且 其中的 price 元素的
文档评论(0)