- 1、本文档共50页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
beautifulsoup420文档—beautifulsoup420documentation
Beautiful Soup 4.2.0 文档
BeautifulSoup是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢
的转换器实现惯用的文档导航,查找,修改文档的方式.BeautifulSoup会帮你节省数小时甚至
数天的工作时间.
这篇文档介绍了BeautifulSoup4中所有主要特性,并且有小例子.让我来向你展示它适合做什
么,如何工作,怎样使用,如何达到你想要的效果,和处理异常情况.
文档中出现的例子在Python2.7和Python3.2中的执行结果相同
你可能在寻找BeautifulSoup3的文档,BeautifulSoup3目前已经停止开发,我们推荐在现
在的项目中使用BeautifulSoup4,移植到BS4
寻求帮助
如果你有关于BeautifulSoup的问题,可以发送邮件到讨论组.如果你的问题包含了一段需要
转换的HTML代码,那么确保你提的问题描述中附带这段HTML文档的代码诊断 [1]
快速开始
下面的一段HTML代码将作为例子被多次用到.这是爱丽丝梦游仙境的的一段内容(以后内
容中简称为爱丽丝的文档)
html_doc
htmlheadtitleThe Dormouses story/title/head
body
p class=titlebThe Dormouses story/b/p
p class=storyOnce upon a time there were three little sisters; and their names were
a href=/elsie class=sister id=link1Elsie/a,
a href=/lacie class=sister id=link2Lacie/a and
a href=/tillie class=sister id=link3Tillie/a;
and they lived at the bottom of a well./p
p class=story.../p
使用BeautifulSoup解析这段代码,能够得到一个BeautifulSoup的对象,并能按照标准的缩
进格式的结构输出
from bs4 import BeautifulSoup
soup BeautifulSoup (html_doc)
print (soup.prettify ())
# html
# head
1 of 50
# title
# The Dormouses story
# /title
# /head
# body
# p class=title
# b
# The Dormouses story
# /b
# /p
# p class=story
# Once upon a time there were three little sisters; and their names were
# a class=sister href=/elsie id=link1
# Elsie
# /a
# ,
# a class=sister href=/lacie id=link2
# Lacie
# /a
# and
# a class=sister href=/tillie id=link2
# Tillie
# /a
# ; and they lived at the bottom of a well.
# /p
# p class=story
# ...
# /p
# /body
# /html
几个简单的浏览结构化数据的方法
soup.title
# titleThe Dormouses story/title
# utitle
soup.title.string
# uThe Dormouses story
# uhead
soup.p
# p class=titlebThe Dormouses story/b/p
soup.p [class]
# utitle
您可能关注的文档
- (带红章)监理新规范表格范本.doc
- (泉州)幼儿园游戏课程实践路径.ppt
- (恒泰)2017年7月第2周市政项目巡查周报(项目二处77-713日).ppt
- (苏教版)二年级语文下册课件晚上“太阳”1.ppt
- (课件3)凶险型前置胎盘处置上十个值得注意问题(江西省妇.ppt
- 2015-2016学年高中历史必修二学案专题二专题学习总结ppt.ppt
- (城市规划原理第三版王克强等编课件)第二章城市规划任务、体系和编制程序.pdf
- 2015-2016学年高二历史人教版必修3配套课件第一单元第2课“罢黜百家,独尊儒术”.ppt
- 2015-2016学年高二历史人民版必修3配套课件专题一第2课汉代儒学.ppt
- 2015-2016学年高二化学人教版选修5课件312酚ppt.ppt
文档评论(0)