- 1、本文档共59页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Pyt的hon-Requests库入门1
WS01
嵩天
The Website is the API…
Requests
自动爬取HTML页面
自动网络请求提交
掌握定向网络数据爬取和网页解析的基本能力
网络爬虫与信息提取
O4X -Tian
Win平台: “以管理员身份运行”cmd ,执行pip install requests
方法 说明
requests.request() 构造一个请求,支撑以下各方法的基础方法
requests.get() 获取HTML网页的主要方法,对应于HTTP的GET
requests.head() 获取HTML网页头信息的方法,对应于HTTP的HEAD
requests.post() 向HTML网页提交POST请求的方法,对应于HTTP的POST
requests.put() 向HTML网页提交PUT请求的方法,对应于HTTP的PUT
requests.patch() 向HTML网页提交局部修改请求,对应于HTTP的PATCH
requests.delete() 向HTML页面提交删除请求,对应于HTTP的DELETE
requests.get()
r = requests.get(url)
返回一个包含服务器 构造一个向服务器请求
资源的Response对象 资源的Request对象
Response Request
requests.get(url, params=None, **kwargs)
∙ url : 拟获取页面的url链接
∙ params : url中的额外参数,字典或字节流格式,可选
∙ **kwargs : 12个控制访问的参数
requests.get(url, params=None, **kwargs)
Requests 2
r = requests.get(url)
Response Request
Response对象包含爬虫返回的内容
Response
Response对象包含服务器返回的所有信息,也包含请求的Request信息
Response (1)
属性 说明
r.status_code HTTP请求的返回状态,200表示连接成功,404表示失败
r.text HTTP响应内容的字符串形式,即,url对应的页面内容
r.encoding 从HTTP header中猜测的响应内容编码方式
r.apparent_encoding 从内容中分析出的响应内容编码方式(备选编码方式)
r.content HTTP响应内容的二进制形式
Response
您可能关注的文档
- PLC旋转的木马控制.ppt
- PLC教的程10-通讯.ppt
- plc故的障处理.ppt
- PLC的应用-课件09.ppt
- PLC的基础知识大全.ppt
- PLC的编程方法(状态法).ppt
- PLC的实验指导书.doc
- PLC教程的6-基本应用指令.ppt
- Pl的c程序设计_S7-200.ppt
- PLC的考试重点-河南理工大学.pptx
- 2024-2030年版中国代理记账行业发展战略及投资运作模式分析报告.docx
- 2025年上教版选择性必修3物理下册月考试卷含答案.docx
- 2025年度农药产品国际认证代理合同范本.docx
- 2013广西会计从业资格《财经法规》冲刺试题.pdf
- 应急设备的维护和检查(4篇).doc
- 第二单元课题2氧气九年级化学人教版(2024)上册.pptx
- 2024-2030年版中国企业大学行业发展模式及投资可行性分析报告.docx
- 2025年度农药产品安全评价与风险评估合同.docx
- 2024-2030年版中国低钠氢氧化铝行业产能预测及发展可行性研究报告.docx
- 9给物体分类课件科学一年级上册冀人版.pptx
文档评论(0)